Per i giochi a somma zero finiti a due giocatori, i diversi concetti di soluzione teorica dei giochi di equilibrio di Nash, minimax e maximin danno tutti la stessa soluzione. Se i giocatori possono giocare una strategia mista, il gioco ha sempre un equilibrio.
EsempioEdizione
Blu
Rosso
|
A | B | C |
---|---|---|---|
1 |
-30
30
|
10
-10
|
-20
20
|
2 |
10
-10
|
-20
20
|
20
-20
|
La matrice di payoff di un gioco è una rappresentazione conveniente. Consideriamo per esempio il gioco a somma zero per due giocatori raffigurato a destra o sopra.
L’ordine di gioco procede come segue: Il primo giocatore (rosso) sceglie in segreto una delle due azioni 1 o 2; il secondo giocatore (blu), ignaro della scelta del primo giocatore, sceglie in segreto una delle tre azioni A, B o C. Poi, le scelte sono rivelate e il totale dei punti di ogni giocatore è influenzato secondo il payoff per quelle scelte.
Esempio: Rosso sceglie l’azione 2 e Blu sceglie l’azione B. Quando il payoff viene assegnato, Rosso guadagna 20 punti e Blu perde 20 punti.
In questo gioco di esempio, entrambi i giocatori conoscono la matrice di payoff e cercano di massimizzare il numero dei loro punti. Il rosso potrebbe ragionare come segue: “Con l’azione 2, potrei perdere fino a 20 punti e posso vincerne solo 20, mentre con l’azione 1 posso perderne solo 10 ma posso vincerne fino a 30, quindi l’azione 1 sembra molto meglio”. Con un ragionamento simile, il blu sceglierebbe l’azione C. Se entrambi i giocatori prendono queste azioni, il rosso vincerà 20 punti. Se il Blu anticipa il ragionamento di Rosso e la scelta dell’azione 1, il Blu può scegliere l’azione B, in modo da vincere 10 punti. Se il Rosso, a sua volta, anticipa questo trucco e sceglie l’azione 2, questo fa vincere al Rosso 20 punti.
Émile Borel e John von Neumann hanno avuto l’intuizione fondamentale che la probabilità fornisce una via d’uscita da questo enigma. Invece di decidere un’azione definita da intraprendere, i due giocatori assegnano delle probabilità alle loro rispettive azioni, e poi usano un dispositivo casuale che, secondo queste probabilità, sceglie un’azione per loro. Ogni giocatore calcola le probabilità in modo da minimizzare il massimo punto di perdita atteso, indipendentemente dalla strategia dell’avversario. Questo porta ad un problema di programmazione lineare con le strategie ottimali per ogni giocatore. Questo metodo minimax può calcolare probabilmente strategie ottimali per tutti i giochi a somma zero per due giocatori.
Per l’esempio dato sopra, risulta che il Rosso dovrebbe scegliere l’azione 1 con probabilità 4/7 e l’azione 2 con probabilità 3/7, e il Blu dovrebbe assegnare le probabilità 0, 4/7 e 3/7 alle tre azioni A, B e C. Il rosso vincerà quindi 20/7 punti in media per partita.
RisolvereModifica
L’equilibrio di Nash per un gioco a somma zero per due giocatori può essere trovato risolvendo un problema di programmazione lineare. Supponiamo che un gioco a somma zero abbia una matrice di payoff M dove l’elemento Mi,j è il payoff ottenuto quando il giocatore che minimizza sceglie la strategia pura i e il giocatore che massimizza sceglie la strategia pura j (cioè il giocatore che cerca di minimizzare il payoff sceglie la riga e il giocatore che cerca di massimizzare il payoff sceglie la colonna). Assumiamo che ogni elemento di M sia positivo. Il gioco avrà almeno un equilibrio di Nash. L’equilibrio di Nash può essere trovato (Raghavan 1994, p. 740) risolvendo il seguente programma lineare per trovare un vettore u:
Minimizzare: ∑ i u i {displaystyle \sum _{i}u_{i}} Soggetto ai vincoli: u ≥ 0 M u ≥ 1.
Il primo vincolo dice che ogni elemento del vettore u deve essere non negativo, e il secondo vincolo dice che ogni elemento del vettore M u deve essere almeno 1. Per il vettore u risultante, l’inverso della somma dei suoi elementi è il valore del gioco. Moltiplicando u per quel valore si ottiene un vettore di probabilità, che dà la probabilità che il giocatore massimizzatore scelga ciascuna delle possibili strategie pure.
Se la matrice del gioco non ha tutti elementi positivi, basta aggiungere una costante ad ogni elemento che sia abbastanza grande da renderli tutti positivi. Questo aumenterà il valore del gioco di quella costante, e non avrà alcun effetto sulle strategie miste di equilibrio per l’equilibrio.
La strategia mista di equilibrio per il giocatore che minimizza può essere trovata risolvendo il duale del programma lineare dato. Oppure, può essere trovato usando la procedura di cui sopra per risolvere una matrice di payoff modificata che è la trasposizione e la negazione di M (aggiungendo una costante in modo che sia positiva), quindi risolvendo il gioco risultante.
Se tutte le soluzioni del programma lineare sono trovate, esse costituiranno tutti gli equilibri di Nash per il gioco. Al contrario, qualsiasi programma lineare può essere convertito in un gioco a due giocatori a somma zero utilizzando un cambiamento di variabili che lo mette nella forma delle equazioni di cui sopra. Quindi tali giochi sono equivalenti ai programmi lineari, in generale.
Soluzione universaleModifica
Se evitare un gioco a somma zero è una scelta di azione con qualche probabilità per i giocatori, evitare è sempre una strategia di equilibrio per almeno un giocatore in un gioco a somma zero. Per qualsiasi gioco a somma zero per due giocatori in cui un pareggio a zero è impossibile o non credibile dopo l’inizio del gioco, come il poker, non esiste una strategia di equilibrio Nash diversa dall’evitare il gioco. Anche se c’è un pareggio zero-zero credibile dopo l’inizio di un gioco a somma zero, non è migliore della strategia di evitare il gioco. In questo senso, è interessante trovare la ricompensa nel calcolo della scelta ottimale prevale su tutti i giochi a somma zero per due giocatori per quanto riguarda l’iniziare o meno il gioco.
L’esempio più comune o semplice dal sottocampo della psicologia sociale è il concetto di “trappola sociale”. In alcuni casi perseguire l’interesse personale individuale può migliorare il benessere collettivo del gruppo, ma in altre situazioni tutte le parti che perseguono l’interesse personale hanno come risultato un comportamento reciprocamente distruttivo.
ComplessitàModifica
È stato teorizzato da Robert Wright nel suo libro Nonzero: The Logic of Human Destiny, che la società diventa sempre più non-zero-sum man mano che diventa più complessa, specializzata e interdipendente.