Pagini recente » Cod sursa (job #2286465) | Problema satisfiabilităţii formulelor logice de ordinul doi

Atenţie! Aceasta este o versiune veche a paginii, scrisă la 2008-12-09 22:09:04.
Revizia anterioară Revizia următoare

Problema satisfiabilităţii formulelor logice de ordinul doi

(Categoria Algoritmi, Autor Cosmin Negruşeri)

Introducere

Problema satisfiabiltăiţii, notată prescurtat cu SAT, cere determinarea existenţei pentru o formulă booleană $\phi$ a unei artibuiri satisfiabile. O formulă booleană $\phi$ este compusă din variabile logice $(x_{1}, x_{2}, ...)$ , operatori logici ( $\wedge$ şi, $\vee$ sau, $\sim$ non, $\rightarrow$ implicaţie şi $\leftrightarrow$ echivalenţă), şi paranteze. O atribuire de valori booleene pentru variabilele acestei expresii se numeşte atribuire satisfiabilă dacă evaluarea expresiei după atribuirea valorilor dă ca rezultat valoarea de adevăr adevărat. De acum încolo vom folosi pentru simplitate valorile $1$ şi $0$ în loc de adevărat şi fals.

Un exemplu de formulă ar fi $\phi = ((x_{1} \rightarrow x_{2}) \vee \sim((\sim x_{1} \leftrightarrow x_{3}) \vee x_{4})) \wedge \sim x_{2}$ . Aceasta are atribuirea satisfiabilă $\langle x_{1} = 0, x_{2} = 0, x_{3} = 1, x_{4} = 1 \rangle$ pentru că $\phi = ((0 \rightarrow 0) \vee \sim((\sim 0 \leftrightarrow 1) \vee 1)) \wedge \sim 0 = (1 \vee \sim (1 \vee 1)) \wedge 1 = (1 \vee 0) \wedge 1 = 1$ .

Forme normale ale formulelor logice

Orice formulă booleană poate fi transformată în două forme:

Forma normal conjunctivă în care expresia este exprimată ca o conjuncţie de propoziţii, iar fiecare propoziţie este formată din o disjuncţie de literali. Un literal este o variabilă care poate fi sau nu negată. Un exemplu de expresie în forma normal conjunctivă ar fi: $(x_{1} \vee \sim x_{1} \vee \sim x_{2}) \wedge (x_{3} \vee x_{2} \vee x_{4}) \wedge (\sim x_{1} \vee \sim x_{3} \vee \sim x_{4})$ care are pe $(x_{1} \vee \sim x_{1} \vee \sim x_{2})$ ca primă propoziţie cu literalii $x_{1}$ , $\sim x_{1}$ , $\sim x_{2}$ .

Forma normal disjunctivă este formată ca o disjuncţie de propoziţii, fiecare dintre aceste propoziţii fiind o conjuncţie de literali. Un exemplu de o asemenea formulă ar fi următoarea: $(x_{1} \wedge x_{2} \wedge x_{3}) \vee (x_{1} \wedge \sim x_{2} \wedge x_{3}) \vee (x_{1} \wedge \sim x_{2} \wedge \sim x_{3}) \vee (\sim x_{1} \wedge x_{2} \wedge \sim x_{2})$ .

SAT, 3-SAT, 2-SAT

Problema SAT este NP-completă. Defapt, este prima problemă NP-completă găsită. Stephen Cook a demonstrat NP-completitudinea ei în 1971. Pe vremea aceea nu se ştia nici măcar că problemele NP-complete există. Această problemă rămâne NP-completă chiar dacă restricţionăm expresiile la unele care în forma normal conjunctivă au doar trei literali. Problema satisfiabilităţii pentru asemenea expresii se numeşte 3SAT, şi multe probleme pot fi demonstrate a fi NP-complete prin reducerea la această problemă. Din fericire, problema 2SAT, adică cea pentru care în fiecare propoziţie există doar 2 literali se poate rezolva eficient. Restul articolului va prezenta trei metode de rezolvare a problemei 2SAT şi câteva aplicaţii ale acesteia la concursuri de programare.

Soluţii pentru 2-SAT

Un exemplu de problemă 2SAT ar fi satisfiabilitatea formulei $(x_{1} \vee \sim x_{2}) \wedge (\sim x_{1} \vee \sim x_{3}) \wedge (x_{1} \vee x_{2}) \wedge (x_{4} \vee \sim x_{3}) \wedge (x_{4} \vee \sim x_{1})$ . Această formulă este satisfăcută de valorile $\langle x_{1} = 1, x_{2} = 0, x_{3} = 0, x_{4} = 1 \rangle$ . Pentru a satisface întreaga expresie trebuie ca în fiecare propoziţie cel puţin unul din cei doi literali să aibă valoarea de adevăr $1$ .

Soluţie `O(M * 2^N)`

O primă metodă de rezolvare ar fi să încercăm toate cele 2⁴ posibilităţi de atribuire posibilă, dar această metodă are ordinul de complexitate O(M * 2^N) şi este eficientă doar pentru instanţe mici ale problemei.

Soluţie `O(N * M)`

Următoarea soluţie pare trivială, dar găsirea acestui algoritm şi realizarea faptului că el rezolvă corect problema este mai grea decât impresia lăsată după citirea ei. Considerăm o propoziţie oarecare cu două variabile p şi q, apoi una dintre ele, de exemplu p. Dacă literalul în care apare p este negat atunci îi atribuim valoarea 1. Pentru ca propoziţia respectivă să aibă 1 valoarea de adevăr atunci valoarea lui q este fixată. Fixând şi valoarea lui q, probabil şi alte propoziţii ce conţin literalul q vor avea celălalt literal fixat. Propagăm astfel o serie de schimbări. După ce toate schimbările forţate au fost făcute propoziţiile rezultate vor fi de următoarele tipuri: $a \vee b$ , $1 \vee 0$ , $1 \vee 1$ , $1 \vee b$ . Propoziţii de tip $0 \vee b$ nu pot apărea pentru că toate schimbările forţate au fost deja propagate. Dacă apare o propoziţie $0 \vee 0$ atunci alegerea făcută pentru valoarea lui p este greşită. Vom încerca şi alegerea opusă. Dacă ambele duc la o propoziţie de tip $0 \vee 0$ atunci expresia nu poate fi satisfăcută. Propoziţiile de forma $1 \vee 0$ , $1 \vee 1$ , $1 \vee b$ pot fi ignorate. În acest fel am eliminat cel puţin o variabilă şi o propoziţie din expresie. Dacă expresia iniţială era satisfiabilă, atunci şi expresia din care s-au eliminate câteva propoziţii a rămas satisfiabilă. Continuând pe această idee obţinem un algoritm de complexitate O(N * M), pentru că la fiecare atribuire de valoare pentru o variabilă parcurgem şirul de propoziţii o dată.

Să vedem cum funcţionează algoritmul pentru expresia: $(x_{1} \vee \sim x_{2}) \wedge (\sim x_{1} \vee \sim x_{3}) \wedge (x_{1} \vee x_{2}) \wedge (x_{4} \vee \sim x_{3}) \wedge (x_{4} \vee \sim x_{1})$ . Considerăm propoziţia $(x_{1} \vee \sim x_{2})$ şi $\langle x_{2} = 1 \rangle$ . Astfel, vom obţine mai departe $(x_{1} \vee 0) \wedge (\sim x_{1} \vee \sim x_{3}) \wedge (x_{1} \vee 1) \wedge (x_{4} \vee \sim x_{3}) \wedge (x_{4} \vee \sim x_{1})$ . În propoziţia $(x_{1} \vee 0)$ $x_{1}$ trebuie să fie egal cu $1$ . Acum, expresia devine: $(0 \vee \sim x_{3}) \wedge (x_{4} \vee \sim x_{3}) \wedge (x_{4} \vee 0)$ . Din propoziţia $(0 \vee \sim x_{3})$ obţinem $\langle x_{3} = 0 \rangle$ , iar din $(x_{4} \vee 0)$ obţinem $\langle x_{4} = 1 \rangle$ . Deci, atribuirea satisfiabilă este $\langle x_{1} = 1, x_{2} = 0, x_{3} = 0, x_{4} = 1 \rangle$ .

Soluţie O(N²)

O altă soluţie elegantă se bazează pe o metodă randomizată:

atribuim valori booleene arbitrare variabilelor;
cât timp expresia nu este satisfăcută execută
    găsim o propoziţie cu valoarea de adevăr 0;
    schimbăm valoarea de adevăr a oricăreia dintre cele două variabile prezente în propoziţie;  // ceea ce va face ca acea propoziţie să aibă noua valoare de adevăr 1;
sfcâttimp

De ce ar merge acest algoritm? Să presupunem că există o soluţie a problemei, o notăm cu $S$ , iar cu $X$ notăm şirul valorilor curente ale variabilelor. Ne uităm la fiecare pas al algoritmului la numărul de variabile care au valori diferite în soluţie faţă de cele din $X$ (acest număr de diferenţe între elementele de acelaşi index pentru două şiruri se mai numeşte şi distanţă Hamming între şiruri). Fie această valoare la pasul current K. Noi am vrea să avem K = 0. Cum va evolua K pe parcursul algoritmului? La un moment dat noi schimbăm valoarea unei variabile luate aleator dintr-o propoziţie nesatisfăcută. Pentru că în $S$ propoziţia este satisfăcută, înseamnă că cel puţin una dintre cele două variabile ale propoziţiei are valori diferite în $X$ faţă de $S$ . Astfel, operaţia făcută de noi are probabilitate de cel puţin 0.5 să ne aducă mai aproape de soluţie. Vom nota cu $T(i)$ numărul probabil de paşi în care un şir $X$ aflat la distanţa Hamming egală cu i faţă de $S$ , va fi transformat în $S$ . Evident:

$T(0) = 0$ .

$T(i) \le (T(i + 1) + T(i - 1)) / 2 + 1$

Se pune semnul de inegalitate pentru că ambele variabile pot avea valori diferite faţă de cele din soluţie, deci schimbarea valorii oricăreia ar putea să ne aducă mai aproape de soluţie.

Pentru că dacă toate variabilele diferă de soluţie, orice schimbare ne aduce mai aproape de soluţie:

$T(N) = T(N - 1) + 1$

Ne interesează numai limitele superioare, deci folosim doar egalităţi în loc de inegalităţi:

$X(0) = 0, X(i) = (X(i + 1) + X(i - 1))/2 + 1, X(N) = X(N - 1) + 1$

Dacă adunăm toate ecuaţiile obţinem:

$X(0) + X(1) + ... + X(N)$ $= (X(0) + X(1) + 2X(1) + ... + 2X(N - 2) + X(N - 1) + X(N))/2 + N + X(N - 1)$

De aici avem că $(X(1) + X(N) - X(N - 1)) / 2 = N$ , din $X(N) = X(N - 1) + 1$ avem $X(1) = 2N - 1$ . Mai departe avem că $X(2) = 4n - 4 ... X(i) = 2iN - i^2^$ de unde, când $i = N$ avem că $X(N) = N^2^$ .

Astfel, numărul mediu de paşi ai algoritmului este N² iar dacă aplicăm algoritmul în mod aleator de mai multe ori avem o probabilitate foarte mare să ajungem la rezultat.

Soluţie O(M + N)

O a treia soluţie se bazează pe relaţia de implicaţie. Relaţia $\rightarrow$ are următoarea tabelă de adevăr:

$A$	$B$	$A \rightarrow B$
$0$	$0$	$1$
$0$	$1$	$1$
$1$	$0$	$0$
$1$	$1$	$1$

Relaţia de implicaţie are semnificaţia dacă $A$ este adevărat atunci şi $B$ este adevărat. Scriem tabelul expresiei $\sim A \vee B$ şi observăm că acesta este egal cu cel al relaţiei de implicaţie.

$A$	$B$	$\sim A \vee B$
$0$	$0$	$1$
$0$	$1$	$1$
$1$	$0$	$0$
$1$	$1$	$1$

Fiecare clauză $A \vee B$ poate fi scrisă ca două implicaţii $\sim A \rightarrow B$ şi $\sim B \rightarrow A$ . Realizăm un graf al implicaţiilor şi astfel nodurile grafului vor fi variabilele $A$ , $B$ ... şi negaţiile lor $\sim A$ , $\sim B$ ... iar muchiile acestui graf vor fi implicaţiile echivalente cu propoziţiile din expresie. Deci, dacă expresia are M propoziţii graful va avea 2M muchii. Astfel, expresiei $(\sim A \vee \sim B) \wedge (B \vee \sim C) \wedge (B \vee C) \wedge (\sim B \vee \sim D) \wedge (C \vee D)$ îi corespunde graful:

Dacă avem $A \longrightarrow B$ o muchie în graful nostru, atunci dacă literalul $A$ este adevărat atunci şi literalul $B$ trebuie să fie adevărat pentru ca propoziţia reprezentată de muchie să fie satisfăcută. Putem demonstra prin inducţie că dacă există un drum în graf de la literalul $A$ la literalul $B$ , atunci dacă $A$ este adevărat şi $B$ trebuie să fie adevărat. Dacă există un drum de la un literal $X$ la $\sim X$ atunci nu va exista soluţie pentru că nu putem seta în acelaşi timp o variabilă şi valoarea ei negată la valoarea adevărat. De aici rezultă că dacă în graful asociat expresiei există o variabilă $X$ în aceiaşi componentă tare conexă cu $X$ atunci instanţa problemei satisfiabilităţii nu poate fi satisfăcută. Dacă nu există o asemenea variabilă, vom vedea în continuare cum putem rezolva problema. Întâi, facem observaţia că dacă în graf există muchia $A \longrightarrow B$ atunci există şi muchia $\sim B \longrightarrow \sim A$ . Astfel, dacă există un drum de la $A$ la $B$ în graf, aplicând proprietatea menţionată pentru fiecare muchie a drumului, vom găsi un drum de la $\sim B$ la $\sim A$ . Evident, afirmaţia este valabilă şi reciproc: dacă există drum de la $B$ la $A$ atunci vom avea un drum de la nodul $\sim A$ la $\sim B$ . Astfel, dacă avem că $A$ şi $B$ sunt în aceeaşi componentă tare conexă atunci şi nodurile $\sim A$ şi $\sim B$ sunt în aceeaşi componentă tare conexă. Deci dacă nu există doi literali $X$ şi $\sim X$ în aceeaşi componentă tare conexă, putem să împărţim graful în componente tari conexe şi să împerechem componentele câte două astfel ca în fiecare pereche să apară o componentă $U$ cu nişte literali şi altă componentă $\sim U$ cu aceiaşi literali negaţi. Pentru a găsi o soluţie vom determina mai întâi componentele tari conexe ale grafului. Apoi putem contracta fiecare componentă într-un nod. Graful obţinut va fi acciclic. Alegem un nod $u$ în care nu intră nicio muchie (un asemenea nod trebuie să existe pentru a nu exista cicluri), din considerente de simetrie, din nodul lui pereche $\sim u$ nu va ieşi nicio muchie. Literalilor componentei $U$ putem să le dăm valoarea de adevăr $0$ , iar literalilor din componenta pereche $\sim U$ putem să le dăm valoarea de adevăr $1$ . Această alegere nu impune restricţii asupra celorlalţi literali şi elimină câteva variabile din problemă. Repetarea recursivă a acestui pas pe graful rămas va duce la rezolvarea problemei. Determinarea componentelor tari conexe se poate face în complexitatea O(N + M). Pentru a vedea acest algoritm puteţi consulta secţiunea 23.5 a [1]. Iar eliminarea nodurilor de care vorbeam mai sus se poate face în O(N + M) folosind de exemplu o sortare topologică.

Să urmărim cum merge algoritmul nostru pe exemplul de mai sus. Componentele tari conexe sunt următoarele: $\{A\}$ , $\{\sim A\}$ , $\{B, C, \sim D\}$ , $\{\sim B, \sim C, D\}$ . În nodul asociat componentei $\{A\}$ nu intră nici o muchie. Astfel, putem să îi atribuim lui $A$ valoarea $0$ , iar în nodul asociat componentei $\{\sim B, \sim C, D\}$ nu intră nicio muchie, deci putem să îi atribuim lui $B$ valoarea $1$ , lui $C$ valoarea $0$ şi lui $D$ valoarea $1$ . Această atribuire este satisfiabilă după cum vedem în continuare:

$(\sim A \vee \sim B) \wedge (B \vee \sim C) \wedge (B \vee C) \wedge (\sim B \vee \sim D) \wedge (C \vee D)$ $= (\sim 0 \vee \sim 1) \wedge (1 \vee \sim 1) \wedge (1 \vee 1) \wedge (\sim 1 \vee \sim 0) \wedge (1 \vee 0)$ $= 1 \wedge 1 \wedge 1 \wedge 1 \wedge 1 = 1$

infoarena informatica de performanta

Problema satisfiabilităţii formulelor logice de ordinul doi

Introducere

Forme normale ale formulelor logice

SAT, 3-SAT, 2-SAT