Pagini recente » Atasamentele paginii Secventa 2 | Monitorul de evaluare | Monitorul de evaluare | Monitorul de evaluare | Diferente pentru missing-numbers intre reviziile 5 si 6

Diferente pentru missing-numbers intre reviziile #5 si #6

Diferente intre #6 si #7

Diferente intre #4 si #5

Nu exista diferente intre titluri.

Diferente intre continut:

(Categoria _Diverse_, autor _Cosmin Negruseri_)

h2. Problema 1 ( _interviu Microsoft_ )

(toc){width: 25em}*{text-align:center} *Cuprins*
* 'Problema 1 ( _interviu Microsoft_ ) ':missing-numbers#prob1
* 'Problema 2 ( _interviu Microsoft_ ) ':missing-numbers#prob2
* 'Problema 3 ( _interviu Microsoft, lot 1999_ ) ':missing-numbers#prob3
* 'Problema 4 ( _IBM Research: Ponder This_ ) ':missing-numbers#prob4
* 'Problema 5 ':missing-numbers#prob5
* 'Problema 6 (interviu Microsoft ':missing-numbers#prob6
* 'Problema 7 (interviu Microsoft ':missing-numbers#prob7
* 'Problema 8 (interviu Microsoft ':missing-numbers#prob8
 
h2(#prob1). Problema 1 ( _interviu Microsoft_ )

Se dau $n-1$ numere distincte de la $1$ la $n$, sa se dea un algoritm cat mai eficient care sa determine numarul lipsa.
h3. Rezolvare

Prima rezolvare ce ne poate veni in minte este aceea ca pentru fiecare numar de la $1$ la $n$ sa verificam daca numarul curent nu exista in sir prin o parcurgere. Un astfel de algoritm are complexitatea <tex>O(n^{2})</tex> si vom vedea mai departe ca putem obtine solutii mult mai bune.
 
O rezolvare triviala ar fi sa sortam cu metoda noastra preferata numerele si sa le parcurgem pentru a vedea cand $a[i] != i$. Aceasta rezolvare are complexitatea <tex>O(n \log n)</tex>.
 
O rezolvare mai eficienta poate fi data urmarind ideea algoritmului **Quick Sort**. Putem imparti numerele in doua multimi, una in care vom pune mumerele mai mici sau egale cu $n/2$, iar in cealalta numerele mai mari decat $n/2$. Acum vom sti daca numarul lipsa este mai mic sau egal cu $n/2$ sau mai mare ca $n/2$, dupa numarul de elemente din fiecare lista. Astfel in <tex>O(n)</tex> pasi am redus problema la jumatate. Daca avem <tex>T(n)</tex> timpul de executie al acestui algoritm, atunci <tex>T(n) = T(n/2) + O(n) = O(n)</tex>. Deci algoritmul este liniar, si foloseste memorie <tex>O(n)</tex> ignorand memoria consumata de sirul de numere <tex>O(\log n)</tex> pentru stiva din algoritmul _divide et impera_.
 
O alta idee este aceea de a folosi un tabel de dispersie sau un sir de valori _booleene_ care va folosi memorie suplimentara <tex>O(n)</tex>, iar daca folosim biti reducem memoria suplimentara la <tex>O(n/\log n})</tex>.

Prima rezolvare ce ne poate veni in minte este aceea de a verifica daca fiecare numar $1 -> n$ este prezent in sirul nostru, printr-o parcurgere (acest algoritm are complexitatea $O(n^2^)$ ). O alta rezolvare triviala ar fi sa sortam numerele si sa determinam prin parcurgere numarul $i$ pentru care $a[i] != i$ (pentru sortari rapide algoritmul are complexitatea $O(n log n)$ ).

O rezolvare eleganta se foloseste de proprietatea ca suma numerelor naturale de la $1$ la $n$ este $n(n+1)/2$, iar suma numerelor o putem afla prin o parcurgere. Acum determinarea numarului lipsa se face prin scaderea din suma numerelor de la $1$ la $n$ a sumei numerelor noastre. Aceasta solutie are complexitatea <tex>O(n)</tex> ca timp si <tex>O(1)</tex> ca memorie folosita.

O rezolvare mai eficienta poate fi data folosind _Divide et Impera_. Putem imparti numerele in doua multimi, una in care vom pune mumerele mai mici sau egale cu $n/2$, iar in cealalta restul. Acum vom sti din care din cele doua multimi lipseste numarul, dupa numarul de elemente al acestora. Considerand $T(n)$ timpul de executie al algoritmului, atunci complexitatea devine $T(n) = T(n/2) + O(n) = O(n)$. Deci algoritmul este liniar, si foloseste memorie $O(n)$, ignorand memoria consumata de stiva din algoritmul Divide et Impera ( $O(log n)$ ). O alta idee este de a folosi un tabel de dispersie sau un sir de valori booleene care va folosi memorie suplimentara $O(n)$ (poate fi redusa la $O(n/log n)$ daca se lucreaza pe biti).

Daca $n$ este destul de mare, s-ar putea ca $n(n+1)/2$ sa depaseasca domeniul de reprezentare al intregilor de pe calculatorul nostru si ar trebui sa implementam operatii cu numere mari ca solutia anterioara sa produca rezultatul corect. O rezolvare ce nu are aceasta problema se foloseste de operatia **xor** si de proprietatile ei <tex>a \hspace{1mm} xor \hspace{1mm} a = 0</tex> si <tex>a \hspace{1mm} xor \hspace{1mm} b = b \hspace{1mm} xor \hspace{1mm} a</tex>. Vom face suma _xor_ a numerelor <tex>a[i] \hspace{1mm} xor \hspace{1mm} i</tex> cu <tex>i</tex> de la <tex>1</tex> la <tex>n</tex>:

O rezolvare eleganta se foloseste de proprietatea ca suma numerelor naturale de la $1$ la $n$ este $n(n + 1)/2$. Numarul lipsa este egal cu diferenta dintre $n(n + 1 )/2$ si suma numerelor noastre. Aceasta solutie are complexitatea $O(n)$ (parcurgem sirul pentru a determina suma) ca timp si $O(1)$ ca memorie. Daca $n$ este destul de mare, s-ar putea ca $n(n+1)/2$ sa depaseasca domeniul de reprezentare al intregilor, rezultand in necesitatea implementarii operatiilor cu numere mari. Pentru a evita acest lucru folosim operatia **xor** (notata prin ^&and;^ ) si proprietatile ei $a ^&and;^ a = 0$ si $a ^&and;^ b = b ^&and;^ a$. Vom face suma xor a numerelor $a[i] ^&and;^ i$ (1 <= i <= n):
$S = a[ 1 ] ^&and;^ 1 ^&and;^ a[ 2 ] ^&and;^ 2 ^&and;^ ... ^&and;^ a[ n - 1 ] ^&and;^ n - 1 ^&and;^ n$

<tex>S = a[1] \hspace{1mm} xor \hspace{1mm} 1 \hspace{1mm} xor \hspace{1mm} a[2] \hspace{1mm} xor \hspace{1mm} 2 \hspace{1mm} xor \hspace{1mm} ... \hspace{1mm} xor \hspace{1mm} a[n] \hspace{1mm} xor \hspace{1mm} n</tex>

Astfel fiecare numar care apare in sir va fi in suma de doua ori si va fi anulat, iar rezultatul final va fi indicele numarului lipsa. Solutia are compexitatea $O(n)$ ca timp si $O(1)$ ca spatiu.

Astfel fiecare numar care apare in sir va fi in suma de doua ori si va fi anulat, iar pentru numarul lipsa, in suma va aparea doar indicele lui, care este si valoarea finala a sumei. Solutia are compexitatea <tex>O(n)</tex> ca timp si <tex>O(1)</tex> ca spatiu.
 
h2. Problema 2 ( _interviu Microsoft_ )

h2(#prob2). Problema 2 ( _interviu Microsoft_ )

Se da un sir de $n+1$ numere de la $1$ la $n$ in care unul se repeta, iar restul sunt distincte. Sa se dea un algoritm cat mai eficient care sa determine numarul ce se repeta.

Evident, abordarile de la problema anterioara se aplica si aici.

h2. Problema 3 ( lot 1999, _interviu Microsoft_ )

h2(#prob3). Problema 3 ( lot 1999, _interviu Microsoft_ )

Se da o lista inlantuita prin primul ei element. Se cere un algoritm cat mai eficient care sa determine daca lista are sau nu ciclu.
h3. Rezolvare

Fie $n$ numarul total de elemente ale listei. O solutie in <tex>O(n)</tex> timp si <tex>O(n)</tex> memorie ar fi sa parcurgem lista si sa adaugam pe rand elementele listei unui tabel de dispersie. Cand am introdus acelasi element de doua ori in lista este evident ca am gasit un ciclu. O metoda folosita de unii concurenti a fost parcurgerea listei pe o perioada de timp determinata, de exemplu timpul de executie fixat in problema. Acum sunt sanse mari ca daca nu am ajuns la capatul listei aceasta sa aiba ciclu.
 
Exista un algoritm mai elegant ce foloseste memorie suplimentara <tex>O(1)</tex> si este liniar. Acest algoritm se numeste _Algoritmul lui Floyd de detectie a ciclului intr-o lista_. O aplicatie importanta a lui este _Algoritmul Pollard_ <tex>\rho</tex>, folosit pentru factorizarea intregilor cu multe cifre. Algoritmul foloseste doi pointeri $a$ si $b$, unde $a$ se misca de doua ori mai repede decat $b$ in lista, de aceea se mai numeste si _Algoritmul iepurelui si testoasei_.

Fie $n$ numarul total de elemente ale listei. O solutie triviala in $O(n)$ timp si $O(n)$ memorie ar fi sa parcurgem lista si sa adaugam pe rand elementele unui tabel de dispersie (cand apare de doua ori acelasi element rezulta ca am gasit un ciclu). O metoda folosita de unii concurenti este parcurgerea listei pe o perioada de timp determinata (timpul de executie fixat), fiind sanse mari ca un ciclu sa nu existe daca nu s-a gasit nici unul pana la momentul incheierii executiei.

Reprezentarea grafica seamana cu litera greceasca <tex>\rho</tex>. Notam lungimea lantului cu <tex>\lambda</tex> si lungimea ciclului cu <tex>\mu</tex>.

Exista un algoritm mai elegant, care ruleaza tot in timp liniar. El se numeste _Algoritmul lui Floyd de detectie a ciclului intr-o lista_. O aplicatie importanta este _Algoritmul Pollard &rho;_, folosit pentru factorizarea intregilor cu multe cifre. Se folosesc doi pointeri $a$ si $b$, unde $a$ se misca de doua ori mai repede decat $b$ in lista (denumit si _Algoritmul iepurelui si testoasei_). Reprezentarea grafica seamana cu litera greceasca &rho;. Notam lungimea lantului cu &lambda; si lungimea ciclului cu &mu;.

!missing-numbers?missing_numbers_pic2.png!
== code(c) |

a = b = cap
repeta
a = a.next.next
b = a.next
cat timp (a!=b)

//cap - pointer spre capatul listei
a = b = cap;
do{
    b = a -> next;
    a = a -> next -> next;
}while(a != b);

==

Cand $a$ si $b$ sunt amandoi in ciclu, $a$ il va ajunge din nou pe $b$. Puteti vedea exact cum prin analiza cazurilor in care lungimea ciclului e para sau impara. In exemplul desenat, dupa sase iteratii cei doi pointeri vor indica acelasi element.
Pentru determinarea lungimii ciclului se mai poate face o parcurgere in care doar un pointer se misca. Acum dupa ce stim lungimea <tex>\mu</tex> a ciclului putem afla si lungimea <tex>\lambda</tex> a lantului astfel: luam un pointer la inceputul listei si al doilea care a facut deja <tex>\mu</tex> pasi in lista. Acum ii miscam pe cei doi cu aceeasi viteza. Dupa <tex>\lambda</tex> pasi cei doi pointeri vor fi egali. Astfel am obtinut o rezolvare liniara.

Cand $a$ si $b$ sunt amandoi in ciclu, este evident ca la un moment dat $a = b$. In exemplul desenat, dupa sase iteratii cei doi pointeri vor indica acelasi element. Pentru determinarea lungimii ciclului se mai poate face o parcurgere in care doar un pointer se misca. Acum dupa ce stim lungimea &mu; a ciclului, putem afla si lungimea &lambda; a lantului astfel: luam un pointer la inceputul listei si al doilea care a facut deja &mu; pasi in lista (amandoi pointerii au aceeasi viteza). Dupa &lambda; pasi ei vor fi egali. Astfel am obtinut o rezolvare liniara.

h2(#prob4). Problema 4 ( _IBM Research: Ponder This_ )

Un sir de lungime $n$ contine numere intregi din multimea ${1, 2, ..., n-1}$. Folosind _Principiul lui Dirichlet_ deducem ca cel putin un element se repeta. Gasiti un algoritm liniar care afiseaza o valoare ce se repeta, folosind memorie suplimentara constanta si nemodificand la nici un pas vreun element din sir.

h3. Rezolvare

Aici nu merge solutia cu suma xor de la problemele $1$ si $2$ pentru ca numerele pot fi repetate oricum si nu putem folosi relatiile obtinute pentru a determina un numar care se repeta. Daca toate elementele din sir ar fi distincte, atunci sirul ar avea structura unei permutari. Cum ele nu sunt neaparat distincte ne vine ideea de a vedea care este diferenta intre un asemenea sir si o permutare, pentru a folosi idei care apar la permutari (ciclurile acestora). Fiecare element din sirul nostru indica inspre altul, deci il putem considera un graf orientat in care arcele sunt $(i, a[i])$. De exemplu putem face urmatoarea reprezentare pentru sirul $3, 2, 1, 3, 4$:

!missing-numbers?missing_numbers_pic3.png!

Din fiecare nod iese cate un arc si cum sunt un numar finit de noduri rezulta ca din orice nod pornim ajungem intr-un ciclu. Chiar in momentul in care intram in ciclu, acel numar se va repeta, deci vrem ca la inceput sa fim intr-un nod ce nu apartine vreunui ciclu. Spre fericirea noastra un astfel de nod e nodul $n$, pentru ca nici un element $a[i]$ nu va fi egal cu $n$. Deci daca pornim de la nodul $n$ suntem in afara vreunui ciclu si putem sa mergem pe drumul pe care il indica pentru a ajunge eventual intr-un ciclu. Am vazut in problema anterioara cum determinam pentru o lista ce are ciclu lungimea lantului, astfel putem determina elementul de la intrarea in ciclu in complexitate $O(n)$ si problema noastra este rezolvata.

h2. Problema 4 ( _IBM Research: Ponder This_ )

h2(#prob5). Problema 5

Un sir ce poate fi numai citit, de lungime $n$ contine numere intregi din multimea ${1, 2, ..., n-1}$. Folosind principiul lui _Dirichlet_ deducem ca cel putin un element se repeta. Gasiti un algoritm liniar care afiseaza o valoare ce se repeta folosind memorie suplimentara constanta si nemodificand la nici un pas vreun element din sir.

Se da un sir de $N$ intregi ce contine numere intre $1$ si $N$. Sa se determine daca acest numar este o permutare cat mai eficient, fara a distruge sirul.

h3. Rezolvare

Aici nu merge solutia cu suma _xor_ de la problemele $1$ si $2$ pentru ca numerele pot fi repetate oricum si nu putem folosi relatiile obtinute cu ajutorul lor pentru a determina un numar care se repeta.
Daca toate elementele din sir ar fi distincte, atunci sirul ar avea structura unei permutari. Cum ele nu sunt neaparat distincte ne vine ideea de a vedea care este diferenta intre un asemenea sir si o permutare. Astfel vom folosi idei care apar la permutari, cum ar fi ciclurile permutarilor. Fiecare element din sirul nostru indica inspre altul, deci ne putem gandi la sirul nostru ca un graf orientat in care arcele sunt $(i, a[i])$. De exemplu putem face urmatoarea reprezentare pentru sirul $3, 2, 1, 3, 4$:

Pentru ca valorile sirului sunt intregi iar valorile elementelor unei permutari sunt pozitive rezulta ca ne putem folosi de bitul de semn al fiecarui numar pentru ca acesta ramane liber. Vom verifica intai daca exista vreun element negativ in sir. Apoi daca nu exista vom marca elementele parcurse din ciclurile permutarii astfel $a[i] = -a[i]$. Daca trebuie sa marcam un element de doua ori sau in parcurgerea initiala am gasit un numar negativ atunci cele $N$ numere nu reprezinta o permutare. Pentru a aduce sirul inapoi la starea initiala vom schimba toate elementele ce au semn negativ din sir cu valorile lor in modul. Astfel am obtinut o rezolvare liniara ce foloseste spatiu suplimentar $O(1)$.

infoarena informatica de performanta

Diferente pentru missing-numbers intre reviziile #5 si #6

Nu exista diferente intre titluri.

Diferente intre continut:

Nu exista diferente intre securitate.

Topicul de forum nu a fost schimbat.