Nollsummespel

För ändliga nollsummespel med två spelare ger de olika spelteoretiska lösningsbegreppen Nash-jämvikt, minimax och maximin alla samma lösning. Om spelarna tillåts spela en blandad strategi har spelet alltid en jämvikt.

ExampleEdit

En noll-sum spel
Blå
Röd
A B C
1
-30
30
10
-10
-20
20
2
10
-10
-20
20
20
-20

Ett spels vinstmatris är en bekväm representation. Tänk till exempel på det nollsummespel för två spelare som visas till höger eller ovan.

Spelordningen går till på följande sätt: Den första spelaren (röd) väljer i hemlighet en av de två handlingarna 1 eller 2. Den andra spelaren (blå), som inte känner till den första spelarens val, väljer i hemlighet en av de tre handlingarna A, B eller C. Därefter avslöjas valen och varje spelares totala poängsumma påverkas i enlighet med avkastningen för dessa val.

Exempel: Röd väljer åtgärd 2 och Blå väljer åtgärd B. När utdelningen fördelas får Röd 20 poäng och Blå förlorar 20 poäng.

I detta exempelspel känner båda spelarna till utdelningsmatrisen och försöker maximera antalet poäng. Röd skulle kunna resonera på följande sätt: ”Med åtgärd 2 kan jag förlora upp till 20 poäng och bara vinna 20, och med åtgärd 1 kan jag bara förlora 10 men vinna upp till 30, så åtgärd 1 ser mycket bättre ut. Med ett liknande resonemang skulle Blå välja åtgärd C. Om båda spelarna gör dessa åtgärder kommer Röd att vinna 20 poäng. Om Blå förutser Röds resonemang och val av åtgärd 1 kan Blå välja åtgärd B för att vinna 10 poäng. Om Röd i sin tur förutser detta trick och väljer åtgärd 2 vinner Röd 20 poäng.

Émile Borel och John von Neumann hade den grundläggande insikten att sannolikheten erbjuder en väg ut ur denna gåta. I stället för att bestämma sig för en bestämd åtgärd tilldelar de två spelarna sannolikheter till sina respektive åtgärder och använder sedan en slumpmässig anordning som enligt dessa sannolikheter väljer en åtgärd åt dem. Varje spelare beräknar sannolikheterna så att den maximala förväntade poängförlusten minimeras oberoende av motståndarens strategi. Detta leder till ett linjärt programmeringsproblem med optimala strategier för varje spelare. Denna minimax-metod kan beräkna troligen optimala strategier för alla nollsummespel med två spelare.

För exemplet ovan visar det sig att Röd bör välja åtgärd 1 med sannolikhet 4/7 och åtgärd 2 med sannolikhet 3/7, och Blå bör tilldela sannolikheterna 0, 4/7 och 3/7 till de tre åtgärderna A, B och C. Röd kommer då att vinna 20/7 poäng i genomsnitt per spel.

LösningEdit

Nash-jämvikt för ett nollsummespel med två spelare kan hittas genom att lösa ett linjärt programmeringsproblem. Anta att ett nollsummespel har en utbetalningsmatris M där elementet Mi,j är den utbetalning som erhålls när den minimerande spelaren väljer ren strategi i och den maximerande spelaren väljer ren strategi j (dvs. spelaren som försöker minimera utbetalningen väljer raden och spelaren som försöker maximera utbetalningen väljer kolumnen). Anta att varje element i M är positivt. Spelet kommer att ha minst en Nash-jämvikt. Nash-jämvikten kan hittas (Raghavan 1994, s. 740) genom att lösa följande linjära program för att hitta en vektor u:

Minimera: ∑ i u i {\displaystyle \sum _{i}u_{i}} Med förbehåll för begränsningarna: u ≥ 0 M u ≥ 1.

Den första begränsningen säger att varje element i vektorn u måste vara icke-negativt, och den andra begränsningen säger att varje element i vektorn M u måste vara minst 1. För den resulterande u-vektorn är inversen av summan av dess element spelets värde. Genom att multiplicera u med detta värde får man en sannolikhetsvektor som ger sannolikheten för att den maximerande spelaren kommer att välja var och en av de möjliga rena strategierna.

Om spelmatrisen inte har alla positiva element, lägger man helt enkelt till en konstant till varje element som är tillräckligt stor för att göra dem alla positiva. Det kommer att öka spelets värde med den konstanten, och kommer inte att ha någon effekt på de blandade jämviktsstrategierna för jämvikten.

Den blandade jämviktsstrategin för den minimerande spelaren kan hittas genom att lösa dualen av det givna linjära programmet. Eller så kan den hittas genom att använda ovanstående förfarande för att lösa en modifierad utbetalningsmatris som är transponeringen och negationen av M (genom att lägga till en konstant så att den är positiv), och sedan lösa det resulterande spelet.

Om alla lösningar till det linjära programmet hittas, kommer de att utgöra alla Nash-jämvikter för spelet. Omvänt kan vilket linjärt program som helst omvandlas till ett nollsummespel med två spelare genom att använda en förändring av variablerna som gör att det hamnar i form av ovanstående ekvationer. Sådana spel är alltså generellt sett likvärdiga med linjära program.

Universell lösningRedigera

Om det är ett handlingsval med viss sannolikhet för spelarna att undvika ett nollsummespel är det alltid en jämviktsstrategi för minst en spelare i ett nollsummespel att undvika. För varje nollsummespel med två spelare där ett drag med noll-noll är omöjligt eller icke trovärdigt efter det att spelet påbörjats, t.ex. poker, finns det ingen annan Nash-jämviktsstrategi än att undvika spelet. Även om det finns en trovärdig noll-noll-utdragning efter det att ett nollsummespel har inletts, är den inte bättre än strategin att undvika. I denna mening är det intressant att finna reward-as-you-go i optimal valberäkning ska råda över alla nollsummespel med två spelare när det gäller att starta spelet eller inte.

Det vanligaste eller enklaste exemplet från delområdet socialpsykologi är begreppet ”sociala fällor”. I vissa fall kan det att driva individuella personliga intressen öka gruppens kollektiva välbefinnande, men i andra situationer leder alla parters personliga intressen till ett ömsesidigt destruktivt beteende.

KomplexitetRedigera

Det har teoretiserats av Robert Wright i hans bok Nonzero: The Logic of Human Destiny, att samhället blir alltmer icke-nollsummatiskt i takt med att det blir mer komplext, specialiserat och beroende av varandra.

Lämna ett svar

Din e-postadress kommer inte publiceras.