Joc cu sumă nulă

Pentru jocurile finite cu sumă nulă cu doi jucători, diferitele concepte de soluție din teoria jocurilor de echilibru Nash, minimax și maximin dau toate aceeași soluție. Dacă jucătorilor li se permite să joace o strategie mixtă, jocul are întotdeauna un echilibru.

ExempluEdit

Un joc cu sumă zero.sumă zero
Albastru
Roșu
A B C
1
-30
30
10
-10
-20
20
2
10
-10
-20
20
20
-20

Matricea de câștiguri a unui joc este o reprezentare convenabilă. Să considerăm, de exemplu, jocul cu sumă nulă cu doi jucători ilustrat în dreapta sau mai sus.

Ordinea de joc se desfășoară după cum urmează: Primul jucător (roșu) alege în secret una dintre cele două acțiuni 1 sau 2; al doilea jucător (albastru), neștiind de alegerea primului jucător, alege în secret una dintre cele trei acțiuni A, B sau C. Apoi, alegerile sunt dezvăluite și totalul de puncte al fiecărui jucător este afectat în funcție de câștigul pentru aceste alegeri.

Exemplu: Roșu alege acțiunea 2 și Albastru alege acțiunea B. Când se alocă câștigul este alocat, Roșu câștigă 20 de puncte, iar Albastru pierde 20 de puncte.

În acest exemplu de joc, ambii jucători cunosc matricea de câștiguri și încearcă să-și maximizeze numărul de puncte. Roșu ar putea raționa după cum urmează: „Cu acțiunea 2, aș putea pierde până la 20 de puncte și pot câștiga doar 20, iar cu acțiunea 1 pot pierde doar 10, dar pot câștiga până la 30, așa că acțiunea 1 pare mult mai bună.” Cu un raționament similar, Albastru ar alege acțiunea C. Dacă ambii jucători iau aceste acțiuni, Roșu va câștiga 20 de puncte. Dacă Albastru anticipează raționamentul și alegerea acțiunii 1 de către Roșu, acesta poate alege acțiunea B, astfel încât să câștige 10 puncte. Dacă Roșu, la rândul său, anticipează acest truc și alege acțiunea 2, acest lucru îi aduce lui Roșu 20 de puncte.

Émile Borel și John von Neumann au avut intuiția fundamentală că probabilitatea oferă o cale de ieșire din această enigmă. În loc să se decidă asupra unei acțiuni certe pe care să o întreprindă, cei doi jucători atribuie probabilități acțiunilor lor respective și apoi folosesc un dispozitiv aleatoriu care, în funcție de aceste probabilități, alege o acțiune pentru ei. Fiecare jucător calculează probabilitățile astfel încât să minimizeze pierderea maximă de puncte așteptată, independent de strategia adversarului. Aceasta conduce la o problemă de programare liniară cu strategiile optime pentru fiecare jucător. Această metodă minimax poate calcula probabil strategiile optime pentru toate jocurile cu sumă nulă cu doi jucători.

Pentru exemplul dat mai sus, se pare că Roșu ar trebui să aleagă acțiunea 1 cu probabilitatea 4/7 și acțiunea 2 cu probabilitatea 3/7, iar Albastru ar trebui să atribuie probabilitățile 0, 4/7 și 3/7 celor trei acțiuni A, B și C. Astfel, Roșu va câștiga în medie 20/7 puncte pe partidă.

RezolvareEdit

Equilibrul Nash pentru un joc cu doi jucători, cu sumă nulă, poate fi găsit prin rezolvarea unei probleme de programare liniară. Să presupunem că un joc cu sumă nulă are o matrice de câștiguri M în care elementul Mi,j este câștigul obținut atunci când jucătorul care minimizează alege strategia pură i și jucătorul care maximizează alege strategia pură j (adică jucătorul care încearcă să minimizeze câștigul alege rândul și jucătorul care încearcă să maximizeze câștigul alege coloana). Să presupunem că fiecare element din M este pozitiv. Jocul va avea cel puțin un echilibru Nash. Echilibrul Nash poate fi găsit (Raghavan 1994, p. 740) prin rezolvarea următorului program liniar pentru a găsi un vector u:

Minimiza: ∑ i u i u i {\displaystyle \sum _{i}u_{i}}}. Sub rezerva constrângerilor: u ≥ 0 M u ≥ 1.

Prima constrângere spune că fiecare element al vectorului u trebuie să fie nenegativ, iar a doua constrângere spune că fiecare element al vectorului M u trebuie să fie cel puțin 1. Pentru vectorul u rezultat, inversul sumei elementelor sale este valoarea jocului. Înmulțind u cu această valoare se obține un vector de probabilitate, care dă probabilitatea ca jucătorul maximizator să aleagă fiecare dintre strategiile pure posibile.

Dacă matricea jocului nu are toate elementele pozitive, pur și simplu adăugați o constantă la fiecare element care este suficient de mare pentru a le face pe toate pozitive. Acest lucru va crește valoarea jocului cu acea constantă și nu va avea niciun efect asupra strategiilor mixte de echilibru pentru echilibru.

Strategia mixtă de echilibru pentru jucătorul minimizator poate fi găsită prin rezolvarea dualului programului liniar dat. Sau poate fi găsită prin utilizarea procedurii de mai sus pentru a rezolva o matrice de câștiguri modificată care este transpunerea și negația lui M (adăugând o constantă astfel încât să fie pozitivă), apoi rezolvând jocul rezultat.

Dacă se găsesc toate soluțiile programului liniar, acestea vor constitui toate echilibrele Nash pentru joc. Invers, orice program liniar poate fi transformat într-un joc cu doi jucători, cu sumă nulă, folosind o schimbare de variabile care îl pune în forma ecuațiilor de mai sus. Deci astfel de jocuri sunt echivalente cu programele liniare, în general.

Soluție universalăEdit

Dacă evitarea unui joc cu sumă zero este o alegere de acțiune cu o anumită probabilitate pentru jucători, evitarea este întotdeauna o strategie de echilibru pentru cel puțin un jucător la un joc cu sumă zero. Pentru orice joc cu sumă nulă cu doi jucători în care o remiză zero-zero este imposibilă sau necredibilă după începerea jocului, cum ar fi pokerul, nu există nicio strategie de echilibru Nash alta decât evitarea jocului. Chiar dacă există o remiză zero-zero credibilă după începerea unui joc cu sumă zero, aceasta nu este mai bună decât strategia de evitare. În acest sens, este interesant să constatăm că recompensarea în calculul alegerii optime prevalează asupra tuturor jocurilor cu sumă zero cu doi jucători în ceea ce privește începerea sau nu a jocului.

Cel mai comun sau mai simplu exemplu din subdomeniul psihologiei sociale este conceptul de „capcane sociale”. În unele cazuri, urmărirea interesului personal individual poate spori bunăstarea colectivă a grupului, dar în alte situații, toate părțile care urmăresc interesul personal au ca rezultat un comportament reciproc distructiv.

ComplexitateEdit

Acesta a fost teoretizat de Robert Wright în cartea sa Nonzero: The Logic of Human Destiny, că societatea devine din ce în ce mai mult non-zero-sum pe măsură ce devine mai complexă, specializată și interdependentă.

>.

Lasă un răspuns

Adresa ta de email nu va fi publicată.