Heavy path decomposition

(Categoria Algoritmi, autor Marius Stroe)

Acest articol prezinta studiul unei probleme ce urmareste determinarea eficienta a valorii maxime/minime aflata pe lantul elementar dintre doua noduri date dintr-un arbore. Mentionez ca, in acest articol, lant va insemna intotdeauna lant elementar (un nod poate aparea cel mult odata).

Enunt

In continuare voi prezenta enuntul unui tip de problema ce a aparut la multe dintre concursurile de informatica. Motivul pentru care am ales acest lucru este ca unii participanti pot fi tentati sa incerce sa adapteze rezolvarea acesteia la rezolvarea problemei ce necesita heavy path decomposition. Lucru ce nu este posibil, pierzand astfel timp pretios. Iata enuntul:

Fie G = (V, E) un graf neorientat conex, |E| = |V| - 1 (pe scurt, un arbore). Vom considera ca fiecare nod x ∈ V are asociata o valoare value[x] din multimea numerelor reale. Se dau M instructiuni, M <= 200000, de doua tipuri:

primul tip cere sa se afiseze suma valorilor tuturor nodurilor ce se afla pe lantul dintre x, y ∈ V (practic, daca P = (x₀,x₁, x₂, ..., x_n), x₀ = x si x_n = y, este lantul ce uneste cele doua noduri, atunci se cere Δ = ∑ value[u], u ∈ P)
al doilea tip modifica valoarea atasata unui nod.

Solutia `O((M+N)log(N))`

Solutia se foloseste de o tehnica numita liniarizarea arborelui. Aceasta presupune o parcurgere in adancime si retinerea unor informatii necesare pentru interogare si actualizare: seq[], firstPos[], lastPos[]. Iata pseudocodul acestei parcurgeri:

PARCURGE(x)
    seq_len ++;
    seq[seq_len] = value[x];
    firstPos[x] = seq_len;
    pentru fiecare fiu y al lui x executa
        PARCURGE(y); // apeleaza recursiv pentru y
    sfarsit pentru
    seq_len ++;
    seq[seq_len] = -value[x];
    lastPos[x] = seq_len;

Fig. 1: Pentru arborele din figura de mai jos si vectorul de valori value[] = {3, 5, 7, 1, 2, 4}, seq[] construit este ilustrat mai jos. Se observa usor ca tot subarborele unui nod se anuleaza cand este explorat in intregime.

Astfel, s-a construit vectorul seq[] care are urmatoarea proprietate: "daca Δ = ∑ seq[i], firstPos[x] <= i <= firstPos[y], x fiind un stramos al lui y, atunci Δ reprezinta ∑ value[u], u ∈ P, P = (x₀, x₁, x₂, ..., x_n), x₀ = x si x_n = y". Conform acesteia, daca vom determina cel mai apropiat stramos comun dintre doua noduri, atunci nu va fi nevoie decat de un cost cat mai mic pentru calcularea eficienta a sumei pe un interval si modificarea unei valori din acest vector seq[]. Cu ajutorul structurii de date numita arbori de intervale putem obtine costul O(log(N)) pe fiecare din cele doua operatii. Pentru determinarea eficienta a celui mai apropiat stramos comun consultati bibliografia.

Enunt

Acum ne vom concentra asupra sarcinii initiale, de determinare a valorii de maxim/minim. Enuntul este urmatorul:

Fie G = (V, E) un graf neorientat conex, |E| = |V| - 1 (yup, tot arbore). Vom considera, bineinteles, ca fiecare nod x ∈ V are asociata o valoare value[x] din multimea numerelor reale. Se dau M instructiuni, M <= 200000, de doua tipuri:

primul tip cere sa se scrie maximul dintre valorile nodurilor ce se afla pe lantul dintre x, y ∈ V (daca P = (x₀,x₁, x₂, ..., x_n), x₀ = x si x_n = y, atunci se cere Δ = Maxim {value[u] | u ∈ P})
al doilea tip modifica valoarea asociata unui nod.

Solutia `O(M*N)`

Sunt o multitudine de solutii simple ce ne pot trece prin minte. Pentru cea aleasa de mine voi retine un vector parent[] semnificand parintele unui nod calculat printr-un depth-search, si depth[] ce retine adancimea, adica numarul de muchii de la radacina pana la nodul interogat. Cu ajutorul lor, urmatorul pseudocod rezolva primul tip de cerinta:

QUERY(x, y)
    ret = Maxim(value[x], value[y]);
    cat timp x diferit de y executa
        daca depth[x] > depth[y] atunci
            x = parent[x];
            ret = Maxim(ret, value[x]);
        altfel
            y = parent[y];
            ret = Maxim(ret, value[y]);
        sfarsit daca
    sfarsit cat timp
    returneaza ret;

Rezolvarea cerintei a doua se face simplu in O(1) modificand direct value[].

Solutia `O(M*log²(N))`

Voi prezenta intr-un mod indirect cum se ajunge la aceasta complexitate, intrucat exista o solutie relativ asemanatoare celei pe care mi-am propus sa o prezint, insa nu la fel de rapida, numita longest path decomposition. Si, desigur, nu este rau daca stim ceva in plus. :)

Tehnica liniarizarii arborelui nu ne este de folos, deoarece modul de reprezentare a informatiilor nu permite obtinerea unei complexitati mai bune fata de solutia brute force prezentata mai sus.

Insa, cu longest path_decomposition, tehnica ce necesita cunostine minime despre grafuri, vom obtine complexitatea O(M*sqrt(N)*log(N)) urmand pasii de mai jos:

Elimina cel mai lung lant radacina-frunza din arbore si apeleaza recursiv pentru restul componentelor conexe ;
Retine fiecare lant ca un vector Path[].array[] cu noduri ordonate crescator dupa adancime si pastreaza un pointer catre nodul din lantul sau parinte Path[].parent;
Pentru fiecare nod retine lantul caruia apartine whatPath[] si pozitia in vectorul lantului whatPos[].

Este evident ca memoria ocupata este O(N), fiecare nod fiind inclus intr-un singur lant. Numarul maxim de lanturi prin care putem trece pornind din radacina pana intr-una din frunze, este O(sqrt(N)).

Fig. 2: Cazul defavorabil cand sunt O(sqrt(N)) lanturi elementare.

Fie x, y ∈ V, x stramos al lui y. Functia care determina valoarea maxima pe lantul dintre x si y este prezentata in urmatorul pseudocod:

QUERY(x, y)
    ret = value[x];
    cat timp x diferit de y executa
        daca whatPath[x] = whatPath[y] atunci
            ret = Maxim(ret, QUERYAi(Path[ whatPath[y] ], whatPos[x], whatPos[y]));
            y = x;
        altfel
            ret = Maxim(ret, QUERYAi(Path[ whatPath[y] ], 1, whatPos[y]));
            y = Path[ whatPath[y] ].parent;
        sfarsit daca
    sfarsit cat timp
    returneaza ret;

Functia QUERYAi(Path[], lo, hi) returneaza in O(log(N)), cu ajutorul structurii de date arbori de intervale, maximul dintre valorile cuprinse in intervalul [lo, hi].
Raspunsul cerintei de primul tip va fi Maxim(QUERY (lca, x), QUERY (lca, y)), variabila lca fiind cel mai apropiat stramos comun al lui x si y.
Pentru rezolvarea cerintei de tipul doi, vom folosi aceeasi arbori de intervale care vor obtine un cost de O(log(N)) per operatie. Nu voi prezenta aceasta functie aici, ea fiind in detaliu prezentata in una din sursele afisate in Bibliografie.

Complexitatea finala: O(M*sqrt(N)*log(N)).

O imbunatatire pentru aceasta metoda o reprezinta heavy path decomposition, care se foloseste de acelasi algoritm, cu exceptia faptului ca fiul ales pentru determinarea unui lant este cel cu numar maxim de noduri in subarborele sau (heavy) si nu cel cu inaltimea maxima (longest). Prin urmare, numarul maxim de lanturi prin care se trece pentru a ajunge de la un nod la radacina este cel mult O(log(N)) dupa cum se poate vedea si in figura urmatoare:

Fig. 3: Fiecare nod apartine unui singur lant. Lanturile sunt reprezentate de muchii solide.

Complexitatea finala: O(M log^2(N)). In practica, aceasta tehnica se comporta foarte bine si poate fi folosita cu succes. Singurul dezavantaj este ca trebuie scrise multe linii de cod. Voi incerca sa obtin o solutie cat mai scurta cu heavy path decomposition si o voi atasa acestei pagini pentru cei curiosi. :)

Aplicatii

Query on a tree - spoj, 375
Caves and tunnels - timus, Novosibirsk SU Contest, Petrozavodsk training camp, September 2007
Delay - pregatirea lotului national de informatica, 2002.
Omizi - .campion 2005
Arbfind - pregatirea lotului national de informatica, 2006.
CT - Happy Coding 2006

Bibliografie

"Introducere in algoritmi", autori Thomas H. Cormen, Charles E. Leiserson, Ronald R. Rivest
Arbori de intervale si aplicatii in geometrie, autor Dana Lica
Range Minimum Query and Lowest Common Ancestor, autor Daniel Pasaila
LCA: Lowest Common Ancestor, autor Emilian Miron

infoarena informatica de performanta

Heavy path decomposition

Enunt

Solutia O((M+N)log(N))

Enunt

Solutia O(M*N)

Solutia O(M*log2(N))

Aplicatii

Bibliografie

Solutia `O((M+N)log(N))`

Solutia `O(M*N)`

Solutia `O(M*log²(N))`