Atenţie! Aceasta este o versiune veche a paginii, scrisă la 2009-11-02 20:30:40.
Revizia anterioară   Revizia următoare  

Tehnici avansate de programare dinamică

(Categoria Tehnici de programare, autori Catalin Tiseanu, Andrei Homescu)

TODO:

1. Reparat link de la ugly numbers

Plan de atac (probleme-candidat):

1. http://www.main.edu.pl/user.phtml?op=showtask&task=wie&con=PA2009&lang=en (Reducerea complexitatii, transformarea problemei intr-una de construire a unui arbore binar.)

2. http://code.google.com/codejam/contest/dashboard?c=32001#s=p0&a=3 (Boolean tree, programare dinamica simpla pe arbore binar.)

3. http://code.google.com/codejam/contest/dashboard?c=32001#s=p3&a=3 (PermRLE, permutari cu N*2^N)

4. http://code.google.com/codejam/contest/dashboard?c=32010#s=p3&a=3 (problema cu DP pe matrici, aplicam ridicarea la putere pt calcul rapid)

5. http://infoarena.ro/problema/doipatru (joc cu solutie DP, stare in 6 dimensiuni)

Sugestii Silviu

  • poate ca nu trebuie sa spunem tot despre programare dinamica intr-un singur articol; spre exemplu putem facem doua articole: PD basic si PD advanced
  • cred ca era si ceva prin Cartea lui Francu' despre programare dinamica; ar merge incorporat (eventual in pd_basic).

Introducere

Programarea dinamică este o metodă utilă pentru a rezolva probleme care pot fi obţinute prin compunerea a mai multor bucăţi, a căror soluţie poate fi apoi determinată optim. Se bazează în principal pe proprietatea unei probleme de a putea fi rezolvată optim dacă se cunosc soluţii optime la sub-problemele ei.
De menţionat că 'programare' nu se referă aici la scrierea de cod într-un limbaj de programare, ci la 'programare matematica', care constă în optimizarea unei funcţii prin alegerea de valori dintr-o mulţime anume.

Scopul acestui articol nu este să ofere o introducere in programare dinamică (pentru aceasta poate fi consultat excelentul tutorial de pe TopCoder Dynamic Programming : From novice to advanced). În schimb, acest articol îşi propune să ofere nişte 'smenuri' mai avansate de rezolvare a problemelor cu programare dinamică.

Reducerea loop-ului interior

Să considerăm următoarea problema:

Problema 1: Drilling (Algorithmic Engagements 2009, Round 3)

Se da un şir de N numere naturale (a1, a2, ..., aN). Se ştie că un prefix al acestui şir (adică o subsecvenţă de la începutul şirului, posibil nulă) este defect. Toate elementele din acel prefix (şi doar din acel prefix) sunt defecte. Se ştie de asemenea că se poate testa orice poziţie i în timp ai pentru a afla dacă este defectă. Să se determine timpul minim în cazul cel mai defavorabil pentru aflarea lungimii maxime a prefixului şirului care este defect.

Exemplu:

Pentru secvenţa de numere (8 24 12 6), răspunsul ar fi 42. Astfel, se testează mai întâi poziţia 2. Dacă nu este defectă, mai rămâne de testat poziţia 1. Altfel, în cel mai rău caz mai trebuie testate poziţiile 3 şi 4, aducând timpul total la 24 + 12 + 6 = 42.

Rezolvare:

O să începem prin a da altă îmbrăcăminte problemei. Astfel, să ne imaginăm că am construi un arbore binar de căutare pe şirul dat, având drept chei poziţiile din şir, şi drept valori auxiliare valorile poziţiilor respective din şir (un nod cu cheia i va avea valoarea auxiliara ai.
Acum, există mulţi arbori binari de căutare posibile pentru şirul iniţial. Totuşi, să presupunem că am construit unul, pe care îl considerăm de acum ca fixat. Atunci, strategia noastra de testare a elementelor din şir se va desfăşura conforma arborelui. Astfel, testăm mai întâi în poziţia din rădăcină. Dacă poziţia respectivă este defectă, ne ducem în fiul drept. Altfel, mergem in fiul stâng. În ambele cazuri se reia procedeul. Căutarea se termină cand nu mai putem merge într-un fiu.

Să observăm că dacă considerăm costul unui drum în arbore de la rădăcină la o frunză ca suma valorilor auxiliare din drumul (unic) respectiv, atunci se observă că costul strategiei bazate pe acest arbore este chiar costul maxim al unui drum ! De acum încolo, vom defini costul unui arbore ca costul maxim al unui drum de la rădăcină la o frunză. Să exemplificăm pe şirul din exemplu:

Fig. 1: În paranteză sunt valorile auxiliare ataşate cheilor

Se observă că costul maxim al unui drum este 42, minim posibil, exact ca răspunsul din exemplu. Deci, am redus problema la construirea unui arbore binar de căutare, care are costul minim.

Acum devine clară o primă soluţie folosind programarea dinamică. Astfel, să presupunem că notăm cu opt[ i ][ j ] costul minim al unui arbore construit pe cheile din [i,j] (prin asta notăm (i, i + 1, ..., j). Fie r[ i ][ j ] poziţia rădăcinii arborelui cu costul minim. În cazul existenţei mai multor rădăcini posibile, se alege cea mai din stânga. Cum am putea construi arborele de cost minim pe cheile [i,j] ştiind răspunsul pentru instanţele mai mici (subsecvenţele de lungime mai mică ca j-i+1 pe [i,j])? (!) Simplu, arborele de cost minim pe [i,j] se obţine alegând drept rădăcină în mod optim o poziţie k, cu $i \le k \le j$, la care se pune ca fiul stâng arborele optim pentru [i, k-1], şi ca fiu drept arborele optim pentru [k+1, j]. Relaţia de recurenţă devine:

opt[ i ][ j ] = \displaystyle\min_{i \le k \le j} \{a_{k} + \max( opt[i][k-1], opt[k+1][j] )\}
r[ i ][ j ] = \displaystyle\arg \min_{i \le k \le j}\{a_{k} + \max (opt[i][k-1], opt[k+1][j] )\}

Avem opt[i][j] = 0, pentru j < i.
Cazurile de bază sunt opt[i][i] = ai si r[i][i] = i.

Se observă că răspunsul problemei se află în opt[1][N].
Astfel, am obţinut o soluţie în timp O(N^3).

Aici trebuie remarcată asemănarea acestei probleme cu cea a determinării arborelui de căutare optim, atunci cand se dau probabilităţile relative de căutare a cheilor. Această problemă se numeşte 'Optimal Binary Search Tree' în literatura de specialitate şi poate fi găsită şi în Introduction to Algorithms. În aceasta problemă, se poate aplica o reducere a complexităţii datorită faptului că $ r[i][j-1] \le r[i][j] \le r[i+1][j] $ pentru a reduce complexitatea la O(N^2). Această proprietate nu se poate aplica din păcate şi în cazul problemei noastre.

Până acum avem următorul pseudocod pentru calculul recurenţei:

Algoritmul este:
    iniţializează opt şi r
    pentru len = 1, N execută
        pentru i = 1, N - len + 1 execută
            j = i + len - 1;
            opt[i][j] = inf;
            pentru k = i, j execută
                dacă opt[i][j] < a[k] + max(opt[i][k-1], opt[k+1][j]) atunci
                    opt[i][j] = a[k] + max(opt[i][k-1], opt[k+1][j]);
                    r[i][j] = k;
            sfârşit_pentru;
       sfârşit_pentru;
    sfârşit_pentru;

    return opt[1][N];
Sfârşit.

Acum ca să obţinem o complexitate mai bună, ţinând cont şi de numele capitolului, vom încerca să reducem complexitatea loop-ului interior (cel după k).
Să ne uităm mai atent la acest loop.

Fie un interval [i,j] fixat. Acum, opt[i][j] < opt[i][j'], pentru orice j < j'. Similar, opt[i][j] < opt[i'][j], pentru orice i' < i.
Atunci, există un indice k, $i \le k \le j$ astfel încât max(opt[i][o-1], opt[o+1][j]) = opt[o+1][j], pentru orice $i \le o \le k$, şi max(opt[i][o-1], opt[o+1][j]) = opt[i][o-1] pentru orice $k \le o \le j$. După cum ştim, trebuie să aflăm \displaystyle\min_{i \le k \le j} \{a_{k} + \max( opt[i][k-1], opt[k+1][j] )\} . Să definim acum 3 matrici auxiliare:

to_left[ i ][ j ] = ai + opt[ i + 1 ][ j ]
to_right[ i ][ j ] = aj + opt[ i ][ j - 1 ]
inter[ i ][ j ] = \displaystyle\arg \max_{i \le k \le j}\{opt[i][k-1] \le opt[k+1][j]\}

Se observă că inter[i][j] nu reprezintă altceva decât indicele k tratat in paragraful precedent.
De asemenea, inter poate fi calculată în O(N^2) observând o proprietate simplă: $ inter[i][j-1] \le inter[i][j] \le inter[i+1][j] $. Aceasta reiese imediat din monotonia lui opt discutată mai sus. Pseudocodul pentru calculul lui inter este:

Algoritmul este:
    iniţializează opt, inter şi r
    pentru len = 1, N execută
        pentru i = 1, N - len + 1 execută
            j = i + len - 1;
            calculează opt[i][j]
            pentru k = inter[i][j-1], inter[i+1][j] execută
                dacă opt[i][k-1] <= opt[k+1][j] atunci
                    inter[i][j] = k;
            sfârşit_pentru;
       sfârşit_pentru;
    sfârşit_pentru;
Sfârşit.

De menţionat că trebuie avut grijă la cazul când len este mai mic ca 3. Pseudocodul prezentat mai sus este orientativ.
Să vedem acum de ce această modalitate de calcul a lui inter duce la o complexitate de O(N^2).

Alternativ, se poate căuta binar inter[i][j] pentru orice [i,j].

Acum vine ideea decisivă pentru a reduce complexitatea loop-ului: pentru a afla opt[i][j], este suficient să aflăm minimul dintre 2 valori:

  • \displaystyle\min_{i \le k \le inter[i][j]} \{$to\_left[k][j]$\} şi
  • \displaystyle\min_{inter[i][j] < k \le j } \{$to\_right[i][k]$\}

Mai exact,

opt[ i ][ j ] =  \min( \displaystyle\min_{i \le k \le inter[i][j]} \{$to\_left[k][j]$\},
                              \displaystyle\min_{inter[i][j] < k \le j } \{$to\_right[i][k]$\} )

Diferenţa faţă de prima recurentă este evidentă: acum trebuie să aflăm minimul pe un interval de linii, în cazul to_left, şi minimul pe un interval de coloane, în cazul to_right. Atât aflarea mnimului pe un interval, cât şi update-ul acestei valori se poate face în O(logN), folosind arbori de intervale.

Astfel, am redus complexitatea loopului interior de la O(N) la O(logN).

Programare dinamica folosind bitmask

In continuare vom vedea un exemplu de programare dinamica unde vom folosi un bitmask (codificat pe un intreg) pentru a tine spatiul starilor.

Astfel sa presupunem ca avem nevoie sa tinem un vector caracteristic pentru o multime.
Daca cardinalul acesteia este suficient de mic putem folosi un intreg pentru a codifica aceasta informatie astfel:

Fie multimea A = { x1, x2, ... xn }.
Atunci bitmaskul unei partitii a lui A, MASK, va avea bitul i egal cu 1 numai si numai daca xi apartine partitiei.

Desigur, aceasta reprezentare duce la o complexitate direct proportionala cu 2 card(A).

Problema 1: Be a Smart Raftsman (SGU)

Sunteţi membri ai unui echipaj de rafting care constă din N ≤ 10 participanţi. Puteţi naviga pe râu, şi scopul vostru este să treceţi de M ≤ 1000 curenţi consecutivi şi să ajungi de la punctul de început la punctul de sfârşit în timp minim. Cel de-al i-lea curent se caracterizează prin greutatea critică ci, iar al j-lea participant este caracterizat greutatea sa wj. În cazul în care pluta trece prin al i-lea curent cu oameni la bord cu greutatea totală mai mare de ci, ea se răstoarnă. Această parte a rafting-ului este cea mai interesantă, dar este nevoie de timp suplimentar pentru a te urca pe plută după răsturnare. Deci, uneori este mai bine să se urce un grup de oameni cu greutate totală care nu depăşeşte greutatea critică a plutei, în timp ce restul parcurg distanţa pe jos.
Mai formal, vom considera M + 1 puncte P0, P1 ,..., PM, în cazul în care P0 este începutul şi PM este punctul final. Fiecare dintre punctele intermediare Pi (1 ≤ i ≤ M-1) este situat între i-lea şi (i + 1)-lea curent. Dacă pluta se răstoarnă, sunt necesare Di minute pentru a ajunge de la Pi-1 la Pi, altfel sunt necesare di minute. Cel de-al j-lea participant poate merge pe jos de la Pi-1 la Pi în tj minute, iar pentru a se urca sau a coborî din plută are nevoie de sj minute. Înainte de fiecare curent, grupul vostru este împărţit în două părţi. Prima parte trece prin curent cu pluta, iar a doua parte merge pe mal spre următorul punct. Cei care ajung primii îi aşteaptă pe toţi ceilalţi. Apoi, unii participanţi care sunt pe plută se pot da jos, în timp ce alţi participanti care sunt pe mal se pot urca pe plută. Această activitate începe când ajung pluta şi toţi cei de pe mal la punctul stabilit. Timpul total necesar pentru această acţiune este egal cu suma valorilor sj pentru toate persoanele care schimbă locul (persoanele urcă şi coboară pe rând). Nimeni nu poate începe deplasarea la următorul punct, până când nu s-au mutat toţi membrii.
începeţi de la punctul de P0 cu tot grupul pe mal şi trebuie să terminaţi la punctul PM cu toţi participanţii şi pluta pe mal. Nu aveţi voie să părăsiţi pluta la început sau într-un un punct intermediar şi să mergeţi pe jos spre linia de sosire fără ea. Aveţi posibilitatea să urcaţi tot grupul de salvare în plută, dar nu puteţi lăsa pluta goală în timpul călătoriei printr-un curent.
Sarcina voastră este să calculaţi timpul minim necesar pentru a ajunge la linia de sosire.

Rezolvare:

Din enunţ intuim că o componentă a stării trebuie să fie submulţimea participanţilor aflaţi în plută în punctul curent, intuiţie confirmată de numărul mic al participanţilor, N ≤ 10. Există 210 astfel de variante, din care vom exclude varianta în care pluta este goală. O stare a problemei, reprezentănd soluţia unei subprobleme, va fi alcătuită din poziţia curentă a plutei (punctul Pi unde se află) şi submulţimea oamenilor care se află în plută. Observăm că de la punctul precedent au coborât nişte oameni, au urcat alţii apoi pluta a continuat spre punctul curent; aceşti paşi contribuie la timpul total şi reprezintă 2 părţi ale recurenţei soluţiei. Dacă notăm cu Tm[i][S] timpul minim necesar pentru a ajunge în punctul i cu submulţimea S a oamenilor din plută, putem descrie problema prin relaţiile:
 $T[0][0] = 0$
 $T[0][S] = \infty, \forall S \neq 0$
 $T[i][0] = \infty, \forall 1 \le i \le M$
 $T[i][S] = \min_{S'} \{T[i-1][S'] + Uc[S'][S] + Dt[i][S] \}, \forall 1 \le i \le M$ \forall S \neq 0$
unde Uc[S'][S] este timpul necesar pentru urcarea şi coborârea participanţilor din plută astfel încât pornind din starea S' să se ajungă în starea S, iar Dt[i][S] este timpul necesar traversării curentului de la punctul i-1 la punctul i dacă în plută se află participanţii din S. Formulele pentru valorile Uc şi Dt sunt:
 $Uc[S_1][S_2] = \sum_{i \in S_1 - S_2}{s_i} + \sum_{i \in S_2 - S_1}{s_i} $
 $Dt[i][S] = \left\{ 
\begin{array}{l l}
  D_i & \quad \sum_{j \in S}{w_j} > c_i\
  d_i & \quad \sum_{j \in S}{w_j} \le c_i\ 
\end{array} \right. $

Programare dinamica folosind vectori de numere intregi

Problema 1: Ugly numbers (Google Code Jam 2008, Round 1C)

Un număr se numeşte urât dacă este divizibil prin oricare dintre numerele prime de o singură cifră, mai exact 2, 3, 5, 7. Se dă un şir de N cifre. Între fiecare 2 cifre consecutive se poate insera unul dintre semnele + sau -. Dacă nu se inserează un semn, cele 2 cifre sunt concatentate astfel încât să se obţină un număr. Pentru un şir dat de cifre si o variantă de a adăuga semne, prin evaluarea expresiei matematice obţinute prin inserarea semnelor se obţine un număr, numit numărul generat. Să se calculeze câte dintre cele 3N-1 variante de a insera semnele generează numere urâte.

Exemplu:

Pentru cifrele 123456, expresia 1+234-5+6 = 236 care este număr urât, iar 123+4-56 = 71 nu este număr urât.

Rezolvare:

Observăm că un număr este urât dacă dă cel puţin o dată restul 0 la împărţirea la numerele 2, 3, 5, 7. O abordare a problemei este parcurgerea tuturor variantelor de inserare şi calcularea celor 4 resturi, verificând dacă cel puţin unul este 0.
Vom folosi aritmetica modulară pentru a obţine o soluţie mai eficientă a problemei. Vom împărţi cele 3N-1 variante în clase, fiecare clasă reprezentând toate numerele care dau resturile (r2, r3, r5, r7) la împărţirea la cele 4 numere. Calculând pentru fiecare clasă numărul de numere generate, rezultatul final va fi suma valorilor calculate pentru toate clasele pentru care cel puţin un rest este egal cu 0. Intuim că putem utiliza clasele de resturi într-o soluţie cu programare dinamică.
Vom utiliza şirul auxiliar V[i][j] reprezentând numărul format prin concatenarea cifrelor de pe poziţiile consecutive i, i+1, ..., j din şirul dat, fără inserarea unor semne între cifre. De exemplu, V[2][4] = 234. Dacă notăm cu C[i][r2][r3][r5][r7] numărul de variante formate cu primele i cifre pentru care clasa de resturi este (r2, r3, r5, r7). Observăm că orice astfel de variantă se obţine dintr-o variantă cu j < i cifre după care adăugam + sau - apoi concatenăm restul cifrelor până la i fără semne. Dacă resturile pentru varianta cu j cifre erau (r2, r3, r5, r7) atunci resturile pentru varianta nouă (r'2, r'3, r'5, r'7) sunt:
 $r_2' = (r_2 +/- V[j+1][i])\% 2$
 $r_3' = (r_3 +/- V[j+1][i])\% 3$
 $r_5' = (r_5 +/- V[j+1][i])\% 5$
 $r_7' = (r_7 +/- V[j+1][i])\% 7$
Atunci numărul total de variante cu i cifre este suma după toate valorile j ale numerelor de variante cu j cifre:
 $C[i][r_2'][r_3'][r_5'][r_7'] = \sum_{j<i} C[j][r_2][r_3][r_5][r_7]$

pentru i = 1, N execută
        V[i][i] = A[i]
        pentru j = i + 1, N execută
            V[i][j] = V[i][j - 1] + A[i];
        sfârşit pentru;
    sfârşit pentru;

    C[0][0][0][0][0] = 1;
    S = 0;
    pentru i = 1, N execută
        pentru r_2 = 0, 1 execută
            pentru r_3 = 0, 2 execută
                pentru r_5 = 0, 4 execută
                    pentru r_7 = 0, 6 execută
                        C[i][r_2][r_3][r_5][r_7] = 0;
                        pentru j = 0, i - 1 execută
                            C[i][r_2][r_3][r_5][r_7] += C[j][(r_2 + 2 - V[j+1][i])%2)][(r_3 + 3 - V[j+1][i])%3)]
                                                            [(r_5 + 5 - V[j+1][i])%5)][(r_7 + 7 - V[j+1][i])%7)];
                            C[i][r_2][r_3][r_5][r_7] += C[j][(r_2 + V[j+1][i])%2)][(r_3 + V[j+1][i])%3)]
                                                            [(r_5 + V[j+1][i])%5)][(r_7 + V[j+1][i])%7)];
                        sfârşit pentru;

                        dacă i == N şi (r_2 == 0 sau r_3 == 0 sau r_5 == 0 sau r_7 == 0)
                            S += C[i][r_2][r_3][r_5][r_7]
                        sfârşit pentru;
                    sfârşit pentru;
                sfârşit pentru;
            sfârşit pentru;
        sfârşit pentru;
    sfârşit pentru;
    returnează S;

O problemă în abordarea precedentă este calcularea matricii V, ale cărei valori devin foarte mari şi ies din precizia tipurilor de date disponibile. O soluţie posibilă este calcularea câte unei matrici de sume modulo R pentru fiecare rest R, adica a 4 matrici V2, V3, V5 si V7 ale resturilor împărţirii valorilor lui V la cele 4 numere prime. Folosind aritmetica modulară, aceste matrici pot fi calculate direct, fără a calcula V. Altă variantă este utilizarea teoremei chineze a resturilor, prin care un sistem de ecuaţii modulo câteva numere prime între ele poate fi redus la o ecuaţie modulo produsul numerelor date. În cazul nostru, numerele sunt prime, deci putem aplica teorema. Astfel, putem reduce problema resturilor împărţirii la (2, 3, 5, 7) la problema restului împărţirii la 2*3*5*7=210, deci fiecare clasa (r2, r3, r5, r7) se reduce la un rest R < 210. Modificăm pseudocodul astfel:

pentru i = 1, N execută
        V[i][i] = A[i] % 210
        pentru j = i + 1, N execută
            V[i][j] = (V[i][j - 1] + A[i]) % 210;
        sfârşit pentru;
    sfârşit pentru;

    C[0][0] = 1;
    S = 0;
    pentru i = 1, N execută
        pentru r = 0, 209 execută
            C[i][r] = 0;
            pentru j = 0, i - 1 execută
                C[i][r] += C[j][(r + 210 - V[j+1][i]) % 210];
                C[i][r] += C[j][(r + V[j+1][i]) % 210];
            sfârşit pentru;

            dacă i == N şi (r % 2 == 0 sau r % 3 == 0 sau r % 5 == 0 sau r % 7 == 0)
                S += C[i][r];
            sfârşit pentru;
        sfârşit pentru;
    sfârşit pentru;
    returnează S;

To be continued ...