Atenţie! Aceasta este o versiune veche a paginii, scrisă la 2008-03-16 08:25:04.
Revizia anterioară   Revizia următoare  

Probleme cu numere lipsa si nu numai ...

(Categoria Diverse, autor Cosmin Negruseri)

Problema 1 ( interviu Microsoft )

Se dau n-1 numere distincte de la 1 la n, sa se dea un algoritm cat mai eficient care sa determine numarul lipsa.

Rezolvare

Prima rezolvare ce ne poate veni in minte este aceea ca pentru fiecare numar de la 1 la n sa verificam daca numarul curent nu exista in sir prin o parcurgere. Un astfel de algoritm are complexitatea O(n^{2}) si vom vedea mai departe ca putem obtine solutii mult mai bune.

O rezolvare triviala ar fi sa sortam cu metoda noastra preferata numerele si sa le parcurgem pentru a vedea cand a[i] != i. Aceasta rezolvare are complexitatea O(n \log n).

O rezolvare mai eficienta poate fi data urmarind ideea algoritmului Quick Sort. Putem imparti numerele in doua multimi, una in care vom pune mumerele mai mici sau egale cu n/2, iar in cealalta numerele mai mari decat n/2. Acum vom sti daca numarul lipsa este mai mic sau egal cu n/2 sau mai mare ca n/2, dupa numarul de elemente din fiecare lista. Astfel in O(n) pasi am redus problema la jumatate. Daca avem T(n) timpul de executie al acestui algoritm, atunci T(n) = T(n/2) + O(n) = O(n). Deci algoritmul este liniar, si foloseste memorie O(n) ignorand memoria consumata de sirul de numere O(\log n) pentru stiva din algoritmul divide et impera.

O alta idee este aceea de a folosi un tabel de dispersie sau un sir de valori booleene care va folosi memorie suplimentara O(n), iar daca folosim biti reducem memoria suplimentara la O(n/\log n}).

O rezolvare eleganta se foloseste de proprietatea ca suma numerelor naturale de la 1 la n este n(n+1)/2, iar suma numerelor o putem afla prin o parcurgere. Acum determinarea numarului lipsa se face prin scaderea din suma numerelor de la 1 la n a sumei numerelor noastre. Aceasta solutie are complexitatea O(n) ca timp si O(1) ca memorie folosita.

Daca n este destul de mare, s-ar putea ca n(n+1)/2 sa depaseasca domeniul de reprezentare al intregilor de pe calculatorul nostru si ar trebui sa implementam operatii cu numere mari ca solutia anterioara sa produca rezultatul corect. O rezolvare ce nu are aceasta problema se foloseste de operatia xor si de proprietatile ei a \hspace{1mm} xor \hspace{1mm} a = 0 si a \hspace{1mm} xor \hspace{1mm} b = b \hspace{1mm} xor \hspace{1mm} a. Vom face suma xor a numerelor a[i] \hspace{1mm} xor \hspace{1mm} i cu i de la 1 la n:

S = a[1] \hspace{1mm} xor \hspace{1mm} 1 \hspace{1mm} xor \hspace{1mm} a[2] \hspace{1mm} xor \hspace{1mm} 2 \hspace{1mm} xor \hspace{1mm} ... \hspace{1mm} xor \hspace{1mm} a[n] \hspace{1mm} xor \hspace{1mm} n

Astfel fiecare numar care apare in sir va fi in suma de doua ori si va fi anulat, iar pentru numarul lipsa, in suma va aparea doar indicele lui, care este si valoarea finala a sumei. Solutia are compexitatea O(n) ca timp si O(1) ca spatiu.

Problema 2 ( interviu Microsoft )

Se da un sir de n+1 numere de la 1 la n in care unul se repeta, iar restul sunt distincte. Sa se dea un algoritm cat mai eficient care sa determine numarul ce se repeta.

Rezolvare

Evident, abordarile de la problema anterioara se aplica si aici.

Problema 3 ( lot 1999, interviu Microsoft )

Se da o lista inlantuita prin primul ei element. Se cere un algoritm cat mai eficient care sa determine daca lista are sau nu ciclu.

Rezolvare

Fie n numarul total de elemente ale listei. O solutie in O(n) timp si O(n) memorie ar fi sa parcurgem lista si sa adaugam pe rand elementele listei unui tabel de dispersie. Cand am introdus acelasi element de doua ori in lista este evident ca am gasit un ciclu. O metoda folosita de unii concurenti a fost parcurgerea listei pe o perioada de timp determinata, de exemplu timpul de executie fixat in problema. Acum sunt sanse mari ca daca nu am ajuns la capatul listei aceasta sa aiba ciclu.

Exista un algoritm mai elegant ce foloseste memorie suplimentara O(1) si este liniar. Acest algoritm se numeste Algoritmul lui Floyd de detectie a ciclului intr-o lista. O aplicatie importanta a lui este Algoritmul Pollard \rho, folosit pentru factorizarea intregilor cu multe cifre. Algoritmul foloseste doi pointeri a si b, unde a se misca de doua ori mai repede decat b in lista, de aceea se mai numeste si Algoritmul iepurelui si testoasei.

Reprezentarea grafica seamana cu litera greceasca \rho. Notam lungimea lantului cu \lambda si lungimea ciclului cu \mu.