Nulsumsspil

For to-spiller-finite nulsumsspil giver de forskellige spilteoretiske løsningsbegreber Nash-ligevægt, minimax og maximin alle den samme løsning. Hvis spillerne har lov til at spille en blandet strategi, har spillet altid en ligevægt.

EksempelRediger

En nul-sum spil
Blå
Rød
A B C
1
-30
30
10
-10
-20
20
2
10
-10
-20
20
20
-20

Et spils gevinstmatrix er en bekvem repræsentation. Tag f.eks. det nulsumsspil med to spillere, der er afbilledet til højre eller ovenfor.

Den rækkefølge, hvori spillet foregår, er som følger: Den første spiller (rød) vælger i hemmelighed en af de to handlinger 1 eller 2; den anden spiller (blå), som ikke kender til den første spillers valg, vælger i hemmelighed en af de tre handlinger A, B eller C. Derefter afsløres valgene, og hver spillers samlede pointantal påvirkes i overensstemmelse med gevinsten for disse valg.

Eksempel: Rød vælger aktion 2 og Blå vælger aktion B. Når udbetalingen er fordelt, får Rød 20 point og Blå mister 20 point.

I dette eksempelspil kender begge spillere udbetalingsmatrixen og forsøger at maksimere antallet af deres point. Rød kunne ræsonnere på følgende måde: “Med aktion 2 kan jeg tabe op til 20 point og kan kun vinde 20 point, og med aktion 1 kan jeg kun tabe 10 point, men kan vinde op til 30 point, så aktion 1 ser meget bedre ud.” Med samme ræsonnement ville Blå vælge aktion C. Hvis begge spillere tager disse aktioner, vil Rød vinde 20 point. Hvis Blå forudser Røds ræsonnement og valg af aktion 1, kan Blå vælge aktion B, så han vinder 10 point. Hvis Rød til gengæld forudser dette trick og vælger aktion 2, vinder Rød 20 point.

Émile Borel og John von Neumann havde den grundlæggende indsigt, at sandsynligheden giver en vej ud af denne gåde. I stedet for at beslutte sig for en bestemt handling, tildeler de to spillere sandsynligheder for deres respektive handlinger og bruger derefter en tilfældig anordning, som i henhold til disse sandsynligheder vælger en handling for dem. Hver spiller beregner sandsynlighederne på en sådan måde, at det maksimale forventede tab af point minimeres uafhængigt af modstanderens strategi. Dette fører til et lineært programmeringsproblem med de optimale strategier for hver spiller. Denne minimax-metode kan sandsynligvis beregne optimale strategier for alle nulsumsspil med to spillere.

For det ovenfor givne eksempel viser det sig, at Rød bør vælge aktion 1 med sandsynlighed 4/7 og aktion 2 med sandsynlighed 3/7, og Blå bør tildele sandsynlighederne 0, 4/7 og 3/7 til de tre aktioner A, B og C. Rød vil derefter vinde 20/7 point i gennemsnit pr. spil.

LøsningRediger

Nash-ligevægt for et nulsumsspil med to spillere kan findes ved at løse et lineært programmeringsproblem. Antag, at et nulsumsspil har en udbetalingsmatrix M, hvor elementet Mi,j er den udbetaling, der opnås, når den minimerende spiller vælger ren strategi i og den maksimerende spiller vælger ren strategi j (dvs. at den spiller, der forsøger at minimere udbetalingen, vælger rækken, og den spiller, der forsøger at maksimere udbetalingen, vælger kolonnen). Antag, at hvert element i M er positivt. Spillet vil have mindst én Nash-ligevægt. Nash-ligevægten kan findes (Raghavan 1994, s. 740) ved at løse følgende lineære program for at finde en vektor u:

Minimere: ∑ i u i {\displaystyle \sum _{i}u_{i}} Med forbehold af begrænsningerne: u ≥ 0 M u ≥ 1.

Den første begrænsning siger, at hvert element i u-vektoren skal være ikke-negativt, og den anden begrænsning siger, at hvert element i M u-vektoren skal være mindst 1. For den resulterende u-vektor er den inverse af summen af dens elementer spillets værdi. Ved at gange u med denne værdi får man en sandsynlighedsvektor, der angiver sandsynligheden for, at den maksimerende spiller vælger hver af de mulige rene strategier.

Hvis spilmatrixen ikke har alle positive elementer, skal man blot tilføje en konstant til hvert element, der er stor nok til at gøre dem alle positive. Det vil øge spillets værdi med denne konstant og vil ikke have nogen virkning på de blandede strategier for ligevægten.

Den blandede strategi for den minimerende spiller i ligevægt kan findes ved at løse dualet af det givne lineære program. Eller den kan findes ved at bruge ovenstående procedure til at løse en modificeret udbetalingsmatrix, som er transponeringen og negationen af M (ved at tilføje en konstant, så den er positiv), og derefter løse det resulterende spil.

Hvis alle løsningerne til det lineære program er fundet, vil de udgøre alle Nash-ligevægte for spillet. Omvendt kan ethvert lineært program omdannes til et nulsumsspil med to spillere ved hjælp af en ændring af variabler, der bringer det i form af ovenstående ligninger. Sådanne spil svarer altså generelt til lineære programmer.

UniversalløsningRediger

Hvis det at undgå et nulsumsspil er et handlingsvalg med en vis sandsynlighed for spillerne, er undgåelse altid en ligevægtsstrategi for mindst én spiller i et nulsumsspil. For ethvert nulsumsspil med to spillere, hvor et nul-nul-træk er umuligt eller ikke troværdigt, efter at spillet er startet, som f.eks. poker, findes der ingen anden Nash-ligevægtsstrategi end at undgå spillet. Selv hvis der er en troværdig nul-nul-trækning, efter at et nulsumsspil er startet, er det ikke bedre end at undgå strategien. I denne forstand er det interessant at finde reward-as-you-go i optimal valgberegning skal sejre over alle to spilleres nulsumsspil med hensyn til at starte spillet eller ej.

Det mest almindelige eller enkle eksempel fra underområdet socialpsykologi er begrebet “sociale fælder”. I nogle tilfælde kan forfølgelse af individuelle personlige interesser øge gruppens kollektive velbefindende, men i andre situationer resulterer alle parter, der forfølger personlige interesser, i en gensidigt destruktiv adfærd.

KompleksitetRediger

Det er blevet teoretiseret af Robert Wright i hans bog Nonzero: The Logic of Human Destiny, at samfundet bliver i stigende grad ikke-nul-summe, efterhånden som det bliver mere komplekst, specialiseret og indbyrdes afhængigt.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.