Pagini recente » Istoria paginii problema/diff | Atasamentele paginii code_pandas_remake | Diferente pentru utilizator/patrickcplusplus intre reviziile 12 si 13 | Diferente pentru zalgorithm intre reviziile 4 si 5 | Diferente pentru zalgorithm intre reviziile 1 si 2

Diferente pentru zalgorithm intre reviziile #1 si #2

Diferente intre #2 si #3

Nu exista diferente intre titluri.

Diferente intre continut:

Algorimul e folosit pentru a gasi aparitiile unui text pattern intr-un alt text.
Deci avem textul P si textul T; vrem sa gasim toate aparitiile lui P in T.

Algoritmul vine cu o idee in felul urmator: fie stringul S si fie vectorul Z[i] = lungimea celei mai lungi secvente ce incepe la pozitia i si se gaseste la inceputul stringului S; adica, de exemplu daca Z[i] = 5 => secventa 0...4 e la fel cu i,..,i+5-1(fiind cea mai mare => S[5] != S[i+5]) . Bun, acum cunoscand aceste valori pentru fiecare pozitie din S problema determinarii tutoror aparitiilor devine una usoara. Definim stringul S = P(pattern) + T(textul in care vrem sa gasim pattern-ul). Acum avand Z[i] calculat ne vom uita la valorile din Z[] de la pozitiile de unde incepe textul T(adica de la pozitia P.size(), stringul S e indexat de la 0); O aparitie e valabila daca Z[i] >= n(n = lungimea pattern-ului).
Am voi arata cum se calculeaza valorile vectorului Z[] in complexitatea o( S.size() ). Fie stringul S si vectorul Z[];  definesc zBox ca fiind cea mai din dreapta secventa care apare la inceputul sirului. Deci pe parcursul calcularii vectorului Z[] voi tine 2 variabile de genul St = capatul stang unde incepe secventa; Dr = capatul drept, unde se termina( Acest zBox va fi tot timpul cea mai din dreapta secventa; !!!Atentie asta nu inseamna ca e si cea mai lunga). Bun, acum sa presupunem ca sunt la pozitia i. Vreau sa calculez Z[i]; am calculate celelalte valori(0...i-1); Pentru inceput voi imparti pe 2 cazuri :

Algoritmul vine cu o idee in felul urmator: fie stringul S si fie vectorul Z[ i ] = lungimea celei mai lungi secvente ce incepe la pozitia i si se gaseste la inceputul stringului S; adica, de exemplu daca Z[i] = 5 => secventa 0...4 e la fel cu i,..,i+5-1(fiind cea mai mare => S[ 5 ] ! = S[ i+5 ]) . Bun, acum cunoscand aceste valori pentru fiecare pozitie din S problema determinarii tutoror aparitiilor devine una usoara. Definim stringul S = P(pattern) + T(textul in care vrem sa gasim pattern-ul). Acum avand Z[ i ] calculat ne vom uita la valorile din Z[ ] de la pozitiile de unde incepe textul T(adica de la pozitia P . size( ), stringul S e indexat de la 0); O aparitie e valabila daca Z[ i ] > = n(n = lungimea pattern-ului).
Am voi arata cum se calculeaza valorile vectorului Z[ ] in complexitatea o( S . size( ) ). Fie stringul S si vectorul Z[ ];  definesc zBox ca fiind cea mai din dreapta secventa care apare la inceputul sirului. Deci pe parcursul calcularii vectorului Z[ ] voi tine 2 variabile de genul St = capatul stang unde incepe secventa; Dr = capatul drept, unde se termina( Acest zBox va fi tot timpul cea mai din dreapta secventa; Atentie asta nu inseamna ca e si cea mai lunga). Bun, acum sa presupunem ca sunt la pozitia i. Vreau sa calculez Z[ i ]; am calculate celelalte valori(0...i-1); Pentru inceput voi imparti pe 2 cazuri :

Cazul 1) i > Dr => nu pot face nici o observatie logica, deci voi face brutul; adica voi lua caracater cu caracater si voi compara : iau caracterul i si il compar cu caracterul 0, apoi caracterul i+1 il compar cu caracterul 1(ma opresc cand gasesc 2 caractere diferite)

Cazul a) Z[i2] < lungBeta; adica cea mai lunga secventa ce se gaseste la inceputul sirului si incepe la pozitia i2 nu depaseste zBox-ul => Z[i] = Z[i2];
Fie stringul S :

 
St2			I2		Dr2		St			I		Dr
0       1       2      3       4      5        6       7      8      9      10    11     12    13    14
(nu prea are relevanta sa contina si caracatere)
Fie St = 7,   Dr = 12 si i = 10; acum voi muta zBox-ul la inceput =>
lungAlpha = 6; lungBeta = 3;
St2 = 0; Dr2 = 5; i2 = 3;
Eu am calculat Z[i2] si stiu ca e < lungBeta => Z[i] = Z[i2], e adevarat pentru ca Zbox e  la fel cu Zbox2;
 
Cazul b) Z[i2] > lungBeta => Z[i] = lungBeta;
St2				I2	Dr2		St				I	Dr
0       1       2      3       4      5        6       7      8      9      10    11     12    13    14
Acum voi face o modificare, i-ul va fi 11 nu 10 (pentru a fi mai clar pe exemplu)=>
St = 7, Dr = 12, I = 11; => St2 = 0; Dr2 = 5; i2 = 4;
Eu stiu acum ca Z[i2] > lungBeta; deci secventa 4..5 e la fel cu 0..1 si e la fel cu 11..12
Avand in vedere ca Z[i2] > lungBeta => si caracterul 6 e la fel cu caracterul 2;
Doar ca se poate face o observatie din care rezulta ca Z[i] = lungBeta; Pentru a demonstra ca e asa voi presupune ca nu e asa => Z[i] > lungBeta => S[13] = S[6] (care e = S[2]) daca acest lucru ar fi adevarat atunci Zbox-ul nu ar fi secventa 7..12 ci ar fi secventa 7..13 => Presupunerea initiala e falsa => Z[i] = lungBeta
 
Cazul c) Z[i2] = lungBeta => Z[i] = lungBeta + compara();
St2				I2	Dr2		St				I	Dr
0       1       2      3       4      5        6       7      8      9      10    11     12    13    14
Acum Z[i2] = lungBeta, de aici rezulta urmatoarele observatii :
	S[2] != S[6]
	S[6] != S[13]
Doar ca asta nu inseamna ca S[2] != S[13](s-ar putea sa fie la fel; trebuie verificat) => Z[i] = lungBeta + compara(lungBeta, Dr + 1);
Compara( i, j) = e o functie care primeste 2 indici si incepe sa compare caracaterele incepand cu cei 2 indici pana cand gaseste 2 caractere diferite
 
Analiza complexitatii:
	In primul rand complexitatea este liniara O(n + m); n = lungimea stringului P
M = lungimea stringului T; Complexitatea este liniara deoarece fiecare element este vizitat de cel mult 2 ori iar zBox-ul e tot timpul cea mai din dreapta secventa;
 
Mai jos am sa propun o modalitate de implementare a acestui algoritm :
O sa urmeze …

infoarena informatica de performanta

Diferente pentru zalgorithm intre reviziile #1 si #2

Nu exista diferente intre titluri.

Diferente intre continut:

Nu exista diferente intre securitate.

Topicul de forum nu a fost schimbat.