Zéróösszegű játék

A kétfős véges zéróösszegű játékok esetében a különböző játékelméleti megoldási koncepciók, a Nash-egyensúly, a minimax és a maximin mind ugyanazt a megoldást adják. Ha a játékosok vegyes stratégiát játszhatnak, a játéknak mindig van egyensúlya.

PéldaSzerkesztés

Egy nulla-egyenlőségűösszegjáték
Kék
Körös
A B C
1
-30
30
10
-10
-20
20
2
10
-10
-20
20
20
-20

A játék kifizetési mátrixa egy kényelmes ábrázolás. Vegyük például a jobbra vagy fentebb ábrázolt kétfős zéróösszegű játékot.

A játék sorrendje a következőképpen zajlik: Az első játékos (piros) titokban választja a két akció közül az 1-est vagy a 2-est; a második játékos (kék), aki nem tud az első játékos választásáról, titokban választja a három akció közül az A, B vagy C-t. Ezután a választásokat felfedjük, és mindkét játékos pontszáma a választások kifizetésének megfelelően változik.

Példa: A piros a 2. akciót választja, a kék pedig a B akciót. A kifizetés kiosztásakor a piros 20 pontot nyer, a kék pedig 20 pontot veszít.

Ebben a példajátékban mindkét játékos ismeri a kifizetési mátrixot, és megpróbálja maximalizálni a pontjainak számát. Piros a következőképpen érvelhet: “A 2. akcióval akár 20 pontot is veszíthetek, és csak 20-at nyerhetek, az 1. akcióval pedig csak 10 pontot veszíthetek, de akár 30-at is nyerhetek, így az 1. akció sokkal jobbnak tűnik.”. Hasonló érveléssel a kék a C akciót választaná. Ha mindkét játékos ezeket az akciókat választja, a piros 20 pontot nyer. Ha a kék előre látja a piros érvelését és az 1. akciót választja, a kék választhatja a B akciót, így 10 pontot nyer. Ha viszont Piros előre látja ezt a trükköt, és a 2. akciót választja, akkor ezzel Piros 20 pontot nyer.

Émile Borel és John von Neumann alapvető felismerése volt, hogy a valószínűség ad kiutat ebből a rejtélyből. Ahelyett, hogy eldöntenék, hogy melyik akciót választják, a két játékos valószínűségeket rendel a saját akcióikhoz, majd egy véletlenszerű eszközt használnak, amely e valószínűségek alapján választ nekik egy akciót. Mindkét játékos úgy számítja ki a valószínűségeket, hogy az ellenfél stratégiájától függetlenül minimalizálja a maximális várható pontveszteséget. Ez egy lineáris programozási problémát eredményez az egyes játékosok optimális stratégiáival. Ez a minimax módszer valószínűleg optimális stratégiákat tud kiszámítani minden kétfős zéróösszegű játékra.

A fenti példában kiderül, hogy a pirosnak az 1. akciót 4/7 valószínűséggel, a 2. akciót pedig 3/7 valószínűséggel kell választania, a kéknek pedig a három A, B és C akcióhoz 0, 4/7 és 3/7 valószínűséget kell rendelnie. A Piros ekkor játékonként átlagosan 20/7 pontot fog nyerni.

MegoldásSzerkesztés

A kétfős, zéróösszegű játék Nash-egyensúlyát egy lineáris programozási feladat megoldásával lehet megtalálni. Tegyük fel, hogy egy zéróösszegű játéknak van egy M kifizetési mátrixa, amelynek Mi,j eleme az a kifizetés, amelyet akkor kapunk, ha a minimalizáló játékos az i tiszta stratégiát, a maximalizáló játékos pedig a j tiszta stratégiát választja (azaz a kifizetés minimalizálására törekvő játékos a sort, a kifizetés maximalizálására törekvő játékos pedig az oszlopot választja). Tegyük fel, hogy M minden eleme pozitív. A játéknak legalább egy Nash-egyensúlya lesz. A Nash-egyensúlyt úgy találhatjuk meg (Raghavan 1994, 740. o.), hogy a következő lineáris programot oldjuk meg egy u vektor megtalálására:

Minimize: ∑ i u i {\displaystyle \sum _{i}u_{i}} A következő kényszerek mellett: u ≥ 0 M u ≥ 1.

Az első kényszer szerint az u vektor minden elemének nemnegatívnak kell lennie, a második kényszer szerint pedig az M u vektor minden elemének legalább 1-nek kell lennie. Az így kapott u vektor esetében az elemek összegének inverze a játék értéke. Ha megszorozzuk u-t ezzel az értékkel, akkor egy valószínűségi vektort kapunk, amely megadja annak a valószínűségét, hogy a maximalizáló játékos a lehetséges tiszta stratégiák mindegyikét választja.

Ha a játékmátrixnak nem minden eleme pozitív, egyszerűen adjunk minden elemhez egy elég nagy konstansot ahhoz, hogy mind pozitív legyen. Ez megnöveli a játék értékét ezzel a konstanssal, és nincs hatással az egyensúlyi vegyes stratégiákra az egyensúlyhoz.

A minimalizáló játékos egyensúlyi vegyes stratégiáját az adott lineáris program duáljának megoldásával találhatjuk meg. Vagy úgy is meg lehet találni, hogy a fenti eljárással megoldunk egy módosított kifizetési mátrixot, amely az M transzponáltja és negáltja (hozzáadva egy állandót, hogy pozitív legyen), majd megoldjuk az így kapott játékot.

Ha a lineáris program összes megoldását megtaláljuk, akkor ezek alkotják a játék összes Nash-egyensúlyát. Megfordítva, bármelyik lineáris program átalakítható kétfős, zéróösszegű játékká, ha a változók megváltoztatásával a fenti egyenletek formájába hozzuk. Az ilyen játékok tehát általában lineáris programokkal egyenértékűek.

Univerzális megoldásSzerkesztés

Ha a zéróösszegű játék elkerülése a játékosok számára valamilyen valószínűséggel cselekvésválasztás, akkor az elkerülés mindig egyensúlyi stratégia legalább egy játékos számára egy zéróösszegű játékban. Bármely olyan kétfős zéróösszegű játék esetében, ahol a játék megkezdése után lehetetlen vagy nem hihető a nulla-nullás döntetlen, mint például a póker, nincs más Nash-egyensúlyi stratégia, mint a játék elkerülése. Még ha létezik is hiteles nulla-nullás döntetlen a zéróösszegű játék megkezdése után, az sem jobb, mint az elkerülő stratégia. Ebben az értelemben érdekes, hogy a reward-as-you-go az optimális választásszámításban minden két játékos nullszaldós játékában érvényesül a játék megkezdése vagy elmaradása tekintetében.

A szociálpszichológia részterületéről a leggyakoribb vagy legegyszerűbb példa a “szociális csapdák” fogalma. Bizonyos esetekben az egyéni személyes érdekek követése növelheti a csoport kollektív jólétét, más helyzetekben azonban a személyes érdekeket követő minden fél kölcsönösen romboló viselkedést eredményez.

KomplexitásSzerkesztés

Ezt Robert Wright elmélete a Nonzero című könyvében: The Logic of Human Destiny, hogy a társadalom egyre inkább nem nullszaldós lesz, ahogy egyre összetettebbé, specializáltabbá és egymástól függővé válik.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.