Atenţie! Aceasta este o versiune veche a paginii, scrisă la 2008-12-03 22:47:32.
Revizia anterioară   Revizia următoare  

Teoria jocurilor: numerele Sprague Grundy

(Categoria -, Autor Cosmin Negruşeri)

Articol de transcris

Introducere

Domeniu relativ nou şi încă necercetat în adâncime, teoria jocurilor este o ramură a matematicii în care de multe ori primează inventivitatea şi nu cunoştinţele. Tocmai din acest motiv, în cadrul acestui articol vom introduce câteva noţiuni teoretice care ne vor ajuta în rezolvarea unor probleme din teoria jocurilor.
Ingeniozitatea celor pasionaţi poate fi testată prin introducerea unor probleme de teoria jocurilor la concursurile de matematică şi informatică. Deoarece în România, teoria jocurilor nu este studiată în şcoli, problemele din acest domeniu pot pune în dificultate concurenţii.

Ce este jocul NIM?

Pentru început ne vom familiariza cu jocul clasic NIM:

Se consideră n grămezi de pietre. Doi jucători, vor ridica (alternativ) oricâte pietre dintr-o singură grămadă. Câştigătorul este cel care ia ultima piatră.

Soluţie

  • Pentru cazul trivial în care numărul de grămezi este egal cu 1, primul jucător are evident strategie de câştig, el putând lua toate pietrele din grămadă.
  • Dacă numărul de grămezi este egal cu 2, primul jucător are strategie de câştig atunci când numărul de pietre din prima grămadă este diferit de numărul de pietre din cea de-a doua, strategia lui fiind cea de a aduce tot timpul grămada mai mare la numărul de pietre al grãmezii mai mici, şi cum jocul este finit, înseamnă că primul jucător o să aducă jocul în starea (0, 0).
  • Dacă numărul de grămezi este mai mare decât doi strategia se complică şi nu se mai observă cu "ochiul liber". Stările câştigătoare pentru mai multe grămezi sunt acele stări pentru care suma XOR a numerelor de pietre din grămezi este diferită de 0, restul stărilor fiind de pierdere.

De exemplu, dacă avem o gramadă cu o piatră, o gramadă cu trei pietre, o gramadă cu cinci pietre şi o gramadă cu şapte pietre:

o
ooo
ooooo
oooooo

Atunci vom avea:
1 = (0001)2
3 = (0011)2
5 = (0101)2
7 = (0111)2

Efectuând XOR (operatorul ^ în C/C++) între reprezentãrile binare ale numerelor obţinem 0 = (0000)2. Conform propoziţiei de mai sus această stare este de pierdere.

Să demonstrăm cele afirmate. Dintr-o poziţie cu suma XOR egală cu 0, pentru orice mutare ajungem evident la o poziţie cu suma XOR diferită de 0, pentru că luând dintr-o grămadă un număr x de pietre, în suma XOR corespunzătoare noii stări bitul cel mai semnificativ al lui x va avea valoarea 1.

Mai rămâne de demonstrat că din orice poziţie cu suma XOR diferită de 0 putem trece printr-o mutare convenabilă într-o poziţie cu suma XOR egală cu 0. Căutăm o grămadă care are un număr de pietre mai mare sau egal cu cea mai mare putere a lui 2 care apare în suma XOR. Fie x valoarea sumei XOR a tuturor grămezilor şi y numărul de pietre din grămada găsită mai devreme. O mutare "câştigătoare" este extragerea din grămada găsită care are y pietre a y - (x XOR y) pietre (x XOR y este mai mic decât y pentru că se anulează biţii cei mai semnificativi ai lui y şi x). Atunci noua sumă XOR va fi egală cu 0.

De exemplu:
4 ^ 8 ^ 17 = (00100)2 ^ (01000)2 ^ (10001)2 = (11101)2 = 29.

Mutarea câştigătoare constă în a lua din cea de-a treia gramadă un număr de pietre egal cu:
17 - (17 ^ 29) = 17 - 17 ^ 29 = 5 = (00101)2.

După acest pas grămezile vor avea 4, 8, 12 pietre. Ne aflăm astfel într-o stare cu suma XOR egală cu 0.

Probleme care folosesc strategia NIM

Problema 1

Pe o tablă de şah, care are n • m căsuţe, sunt plasaţi pe prima linie n pioni albi şi pe ultima linie n pioni negri. Fiecare dintre cei doi jucători poate muta un singur pion, care îi aparţine, un număr strict pozitiv de căsuţe în sus sau în jos, astfel încât să nu ajungă vreun pion alb să fie mai jos decât pionul negru de pe aceeaşi coloanã. Pierde jucătorul care nu mai poate muta.

Această problemă este o deghizare a jocului NIM, numărul de pătrăţele libere între pionul alb şi pionul negru de pe coloana i putând fi considerat numărul de pietre din grămada i. Singura diferenţă este că se pot adăuga pietre la grămadă (existând posibilitatea mutării înapoi).
Această problemă se rezolvă uşor, jucătorul care are strategie de câştig putând evita asemenea mutări. O astfel de mutare poate fi utilă numai pentru jucãtorul care este într-o poziţie de pierdere.
Când jucătorul care nu are strategie de câştig mută înapoi x căsuţe, celălalt jucător va muta pionul propriu de pe aceeaşi coloanã cu x căsuţe în faţă, astfel ajungându-se la aceeaşi stare cu cea existentă cu două mutări anterior (considerând diferenţa poziţiilor).

Problema 2

Această problemă a fost propusă spre rezolvare participanţilor la barajul pentru lărgirea lotului naţional din 1997.

Pe o linie sunt plasate la coordonate întregi 2 • n piese roşii şi albastre. Fiecare piesă roşie poate fi mutată în dreapta oricâte poziţii astfel încât să nu sară peste o piesă albastră, iar piesele albastre pot fi mutate oricâte poziţii la stânga astfel încât să nu depăşească vreo piesă roşie. Piesele vor alterna: roşu, albastru, roşu, albastru etc. Pierde jucătorul care nu mai poate muta.

Această problemă poate fi, de asemenea, redusă la jocul NIM. Diferenţele poziţiilor perechilor de piese roşii şi albastre consecutive constituie numărul de pietre al grămezilor din jocul NIM.

Problema 3 (El Judge MIPT online programming contest Nim Game Give Away!)

Se consideră n grămezi de pietre, jucătorii mută alternativ, fiecare jucător extrăgând oricâte pietre dintr-o singură grămadă. Cel care ia ultima piatră pierde jocul.

Strategia acestui joc este similară cu cea aplicată în jocul NIM cu câteva mici diferenţe. Jucătorul care are strategie de câştig în poziţia curentă în cadrul jocului NIM face aceeaşi mutare pe care ar face-o în cazul jocului NIM, exceptând cazul în care această mutare lasă doar grămezi cu o singură piatră şi numărul acestor grămezi este par. În această situaţie, dacă ar trebui să ia x pietre, jucătorul poate lua x - 1 pietre din grămada actuală, pentru ca numărul de grămezi să fie impar şi el să facă ultima mutare.

Numerele Sprague Grundy

Jocurile care prezintă interes pentru jucători sunt acelea care necesită examinarea unui număr foarte mare de stări pentru determinarea strategiei de câştig, deoarece în caz contrar câştigătorul s-ar cunoaşte chiar de la început. Spre deosebire de aceştia, matematicienii sau informaticienii sunt interesaţi de determinarea unor strategii pentru astfel de jocuri.
Toate jocurile imparţiale cu doi jucători cu informaţie totală pot fi reduse la jocul NIM care se joacă cu nişte grămezi virtuale, în care mutările posibile sunt extragerea oricâtor pietre dintr-o grămadă sau adăugarea oricâtor pietre la o grămadă (aşa cum am menţionat anterior, adãugarea de pietre la o grămadă nu complică analiza jocului).

Afirmaţia anterioară constituie un rezultat al Teoriei Sprague-Grundy. Roland Percival Sprague (1936) şi Patrick Michael Grundy (1939) sunt doi matematicieni care s-au ocupat, independent, de teoria jocurilor imparţiale.

Majoritatea jocurilor imparţiale se pot reduce la jocul prezentat în problema Pioni de la runda 47 a concursului de programare Bursele Agora. Acolo se menţiona următorul joc:

Se consideră un graf aciclic care conţine în noduri câţiva pioni, jucătorii alternează la mutare şi fiecare poate muta câte un pion pe un arc care iese din nodul în care este situat pionul. Pierde jucătorul care nu poate muta.

Cum graful este aciclic, jocul este finit şi are întotdeauna un câştigător. Practic, acest joc este suma unor jocuri, mai precis suma a mai multor jocuri cu un singur pion pe graful aciclic. Jocul cu un singur pion poate fi analizat destul de uşor, fiecare nod al grafului putând fi colorat cu alb sau negru după cum există sau nu strategie de câştig dacă în nodul curent ar fi poziţionat pionul. Această colorare poate fi realizată uşor dacă se porneşte de la nodurile fără urmaş şi la fiecare pas se colorează câte un nod ai cărui urmaşi sunt deja coloraţi. Orice joc imparţial poate fi redus la un joc cu un singur pion. Nodurile sunt poziţiile jocului şi arcele grafului sunt mutările posibile din fiecare poziţie. Jocul iniţial poate fi şi el transformat, dar numărul de noduri creşte foarte mult (pentru n pioni şi m noduri, numărul de noduri din jocul transformat este nm) şi nu este practic să colorăm graful rezultat. Folosind teoria dezvoltatã de Sprague şi Grundy, putem reduce complexitatea analizei jocului cu n pioni la complexitatea analizei jocului cu un pion.

Vom introduce funcţia mex cu semnificaţia: mex(S) este elementul minimal natural care nu aparţine mulţimii S. Pentru fiecare nod x al grafului aciclic considerat, vom calcula valoarea funcţiei gx = mex(gx1, gx2, …, gxk), unde x1, x2, …, xk sunt urmaşii nodului x în graf. Pentru nodurile fără urmaşi gx = 0.

Analog jocului cu un singur pion, graful poate fi etichetat din aproape în aproape, pornind de la nodurile fără urmaşi. Observăm că, dacă gx = 0 în jocul cu un singur pion situat în nodul x nu avem strategie de câştig, iar dacă gx este diferit de 0 avem strategie de câştig. Restul informaţiei ne ajută la determinarea unei strategii pentru jocul cu n pioni. Observăm că putem reduce acest joc la jocul NIM în care grămada virtuală asociată pionului i are un număr de pietre egal cu valoarea g a nodului în care este situat pionul i.

De ce este acest joc echivalent cu jocul NIM?

Aşa cum la NIM puteam lua oricâte pietre dintr-o grămadă, aici putem muta pionul dintr-un nod cu valoarea g într-un nod astfel încât noua valoare pentru pionul i poate fi orice număr de la 0 la g - 1. Prin urmare, pentru a verifica dacă suntem într-o poziţie de câştig în jocul cu pionii, putem aplica strategia jocului NIM şi obţinem că suntem într-o poziţie de câştig dacă suma XOR a numerelor din nodurile ocupate de cei n pioni este diferită de 0. Această sumă se numeşte funcţia Sprague Grundy, SG{(i~1~, …, i~n~)} = gi1 ^ gi2 ^ gi3 ^ … ^ gin.

Problema de la runda 47 (Pioni) se rezolvă acum uşor efectuând o sortare topologică a nodurilor grafului aciclic şi numerotând nodurile folosind funcţia mex.

Probleme care se pot rezolva folosind numerele Sprague Grundy

Problema 4

Problema Joc a rundei 13 a concursului de programare Bursele Agora putea fi rezolvatã în acest mod.
În acea problemă se cerea să verificăm existenţa unei strategii de câştig pentru un joc similar cu NIM în care se putea lua dintr-o grămadă o piatră sau un număr prim de pietre.

Dacă determinăm valorile Sprague Grundy pentru grămezi de dimensiuni mici putem observa că se repeta o succesiune de numere: 0 1 2 3 0 1 2 3 …
Putem demonstra prin inducţie că această secvenţă se va repeta la nesfărşit.
Pentru o grămadă de dimensiune n valoarea asociată va fi n modulo 4. Pentru 0 ≤ n ≤ 3 afirmaţia este adevărată. Vom presupune afirmaţia adevărată pentru toate valorile m < n. Să demonstrăm acum că este adevărată şi pentru n. Deoarece putem lua din n pietre una, două sau trei pietre, mai rămâne valoarea n modulo 4 care nu este eliminată încă din valorile potenţiale asociate grămezii de dimensiune n. Vom arăta în continuare că această valoare nici nu va fi eliminată. Eliminarea ei ar însemna că putem lua din n un număr p de pietre şi atunci din (n - p) modulo 4 = n modulo 4, am avea: p modulo 4 = 0, dar p este un număr prim, deci valoarea Sprague Grundy asociată unei grămezi de dimensiune n este n modulo 4.

Problema 5 (El Judge MIPT online programming contest, Stone game)

Se consideră k grămezi cu n1, n2, …, nk pietre fiecare. Când este rândul său, un jucător poate lua dintr-o gramadă 2m pietre. Jucătorul care ia ultima piatră câştigă.
Restricţii: k ≤ 50, ni ≤ 10200.

Să determinăm valorile Sprague Grundy pentru grămezi mici:
0 : 0;  1 : 1;  2 : 2;  3 : 0;  4 : 1;  5 : 2;  6 : 0
Observăm şi aici secvenţa repetitivă 0 1 2 0 1 2, deci am putea trage concluzia că valoarea Sprague Grundy asociată unei grămezi de dimensiune n este n modulo 3. Această afirmaţie este adevarată şi urmează aceeaşi demonstraţie ca în cazul problemei anterioare, iar restul modulo 3 pentru n număr cu 200 de cifre este simplu de găsit determinând suma cifrelor numărului.

Problema 6 (El Judge MIPT online programming contest, Stone game II)

Se consideră k grămezi de pietre cu n1, n,2 …, nk pietre. Un jucător poate lua dintr-o grămadă la mutarea lui un număr pozitiv de pietre dar nu mai mult de jumătate din pietrele din grămadă. Jucătorul care nu mai poate muta pierde.
Restricţii: k ≤ 50, ni ≤ 100000.

Numărul 100000 nu este foarte mare şi valorile Sprague Grundy pot fi determinate off-line şi incluse în programul nostru ca şi constante. Putem scrie pentru valori mici secvenţa Sprague Grundy:
1 2 3 4 5 6 7 8 9 10 11 12 13 14
0 1 0 2 1 3 0 4 2 5 1 6 3 7
Pentru n impar valoarea asociată este aceeaşi cu valoarea asociată lui n/2, şi pentru n par valoarea asociată este n/2. Acest lucru se poate demonstra prin inducţie matematică.

Problema 7 (CEOI 2000, Cluj-Napoca, problema Sticks)

Se consideră n (n ≤ 10) rânduri de beţe pe o masă, cu Si (Si ≤ 10) beţe aliniate pe fiecare rând şi doi jucători. Beţele de pe rândul i sunt numerotate secvenţial de la 1 la Si. Cei doi jucători mută alternativ. Fiecare mişcare constă în eliminarea a unu, două sau trei beţe de pe acelaşi rând. Beţele trebuie sã fie numerotate secvenţial, adică să fie consecutive. De exemplu, un rând are 10 beţe şi primul jucător elimină beţele 4, 5, 6, deci vor rămâne numai beţele 1, 2, 3, 4, 8, 9, 10. Al doilea jucător poate lua la rândul său beţele 1, 2, 3, dar nu beţele 3, 7, 8 pentru că acestea nu sunt numerotate consecutiv (bineînţeles că există şi alte mutări valide). Câştigă jucătorul care ia ultimul băţ de pe masă.

Problema generală are o soluţie ingenioasă care ţine seama de parităţile rândurilor, dar la această problemă, datorită mărginirii lui Si (Si ≤ 10) nu este necesar să fim ingenioşi. Restricţia Si ≤ 10, ne ajută prin faptul cã numărul total de poziţii (dacă jucăm pe o singură gramadă), este 210. Vom reprezenta o poziţie printr-un întreg, iar dacă acel întreg are în codificarea lui binară pe poziţia i un bit de 1 înseamnă că el reprezintă un rând de beţe care conţine în el băţul numerotat cu i. Este uşor de realizat un graf aciclic al mişcărilor pentru un rând (graful este aciclic pentru că la fiecare mutare luăm beţe din configuraţie). Numerotăm fiecare poziţie cu numerele Sprague Grundy, şi acum problema deciderii dacă suntem sau nu într-o poziţie câştigătoare devine banală. În problema iniţială trebuia să jucăm împotriva calculatorului şi să câştigăm. Putem realiza aceasta folosind mutarea câştigătoare prezentată la jocul NIM.

Problema 8

Această problemă a fost propusă spre rezolvare la concursul Internet Problem Solving Contest (cel mai prestigios concurs online) şi o puteţi găsi la această adresă. Ea a fost folosită şi la concursul organizat de .campion la o rundă online. Rezolvarea ei, complicată, folosind numerele Sprague Grundy prezentate în acest articol, se poate găsi în [3], pe site-ul [7], sau pe siteul concursului .campion.

Problema 9

Această problemă a fost propusă spre rezolvare la ediţia din acest an a Olimpiadei Naţionale de Informatică din Ucraina.

Doi participanţi mănâncă alternant din nişte tablete de ciocolată după următoarele reguli:
taie o tabletă în două, tăietura trebuie să fie paralelă cu una din laturile tabletei şi trebuie să nu taie pătrăţelele de ciocolată;
poate să rupă şi să mănânce orice linie sau coloană de pătrăţele care nu se aflã pe marginea tabletei;
poate să rupă şi să mănânce toate patrăţelele de pe marginea tabletei, cu condiţia ca tableta rămasă să aibă cel puţin dimensiunea 1×1.
Nici una dintre aceste trei mutări nu poate fi efectuată asupra unei tablete de dimensiune 1×1. Pierde jucătorul care nu mai poate efectua nici o mutare.
În fişierul de intrare se va afla numărul N (1 ≤ N ≤ 100) de tablete, iar pe următoarea linie sunt N perechi de numere întregi care reprezintă dimensiunile tabletelor.
În fişierul de ieşire se va afla un singur număr întreg reprezentând numărul mutărilor câştigătoare pentru primul jucător.

Pentru această problemă vom calcula matricea SGi,j care reprezintă valoarea Sprague-Grundy asociată unei tablete de dimensiuni (i, j). Să vedem care este recurenţa care va satisface elementele matricei SG:

SGi,j = mex(SGi,k ^ SGi,j-k, (1 ≤ k < j) mutarea întâi
SGk,j ^ SGi-k,j, (1 ≤ k < i)
SGi,k ^ SGi,j-k-1, (1 ≤ k < j - 1) mutarea a doua
SGk,j ^ SGi-k-1,j, (1 ≤ k < i - 1)
SGi-2,j-2) (i > 2 şi j > 2) mutarea a treia

Acum, pentru a calcula numărul de mutări câştigătoare efectuăm asupra fiecărei tablete din fişierul de intrare toate mutările posibile care sunt cel mult de 4 • 100 + 1 şi facem suma XOR a valorilor Sprague Grundy pentru restul tabletelor neimplicate în mutare şi a tabletelor rezultate din mutare. Pentru a calcula SGi,j trebuie sã parcurgem cel mult 2 • i + 2 • j + 1 valori obţinute. Astfel, algoritmul de determinare al valorilor matricei SG are ordinul de complexitatea O(N3).
Complexitatea algoritmului care determină numărul de mutări câştigătoare este O(N2).

Am văzut că aceste numere sunt folositoare pentru rezolvarea unor probleme de jocuri combinatorice. Chiar dacă numărul stărilor grafului nostru aciclic poate să fie foarte mare, putem să ne dăm seama, câteodată, din valorile mici de o regulă pe care o urmează numerele, sau măcar putem determina mai uşor configuraţii pentru care jocul are sau nu strategie de câştig, fapt care ne poate ajuta în descoperirea rezolvării generale.

Bibliografie

1. ***, colecţia GInfo
2. Mihai Oltean, Programarea Jocurilor Matematice, Editura Albastră, Cluj-Napoca, 1996
3. Thomas S. Ferguson, Game Theory Text
4. http://www.ams.org/new-in-math/cover/games1.html
5. http://www.cut-the-knot.com
6. http://www.mathworld.wolfram.com
7. http://ipsc.ksp.sk/