Hra s nulovým součtem

U konečných her s nulovým součtem pro dva hráče dávají různé koncepty řešení z teorie her – Nashova rovnováha, minimax a maximin – stejné řešení. Pokud hráči mohou hrát smíšenou strategii, hra má vždy rovnováhu.

PříkladUpravit

Nulová rovnováha.součtová hra
Modrá
Červená
A B C
1
-30
30
10
-10
-20
20
2
10
-10
-20
20
20
-20

Výplatní matice hry je vhodnou reprezentací. Uvažujme například hru s nulovým součtem pro dva hráče zobrazenou vpravo nebo výše.

Pořadí hry probíhá následovně: První hráč (červený) si tajně vybere jednu ze dvou akcí 1 nebo 2; druhý hráč (modrý), který neví o volbě prvního hráče, si tajně vybere jednu ze tří akcí A, B nebo C. Poté jsou volby odhaleny a celkový počet bodů každého hráče je ovlivněn podle výhry za tyto volby.

Příklad: Červený si vybere akci 2 a modrý akci B. Po přidělení výplaty získá červený 20 bodů a modrý 20 bodů ztratí.

V tomto příkladu hry oba hráči znají matici výplat a snaží se maximalizovat počet svých bodů. Červený může uvažovat následujícím způsobem: „S akcí 2 mohu ztratit až 20 bodů a mohu vyhrát jen 20, a s akcí 1 mohu ztratit jen 10, ale mohu vyhrát až 30, takže akce 1 vypadá mnohem lépe.“ Červený si může myslet, že s akcí 2 ztratí až 20 bodů a může vyhrát jen 20. S podobnou úvahou by si modrý hráč vybral akci C. Pokud se oba hráči rozhodnou pro tyto akce, vyhraje červený 20 bodů. Pokud modrý předvídá červeného uvažování a volbu akce 1, může si modrý zvolit akci B, takže vyhraje 10 bodů. Pokud červený naopak tento trik předvídá a zvolí akci 2, získá tím červený 20 bodů.

Émile Borel a John von Neumann přišli se zásadním poznatkem, že pravděpodobnost poskytuje východisko z této hádanky. Místo toho, aby se oba hráči rozhodli pro určitou akci, přiřadí svým akcím pravděpodobnosti a pak použijí náhodné zařízení, které jim podle těchto pravděpodobností akci vybere. Každý hráč vypočítá pravděpodobnosti tak, aby minimalizoval maximální očekávanou bodovou ztrátu nezávisle na strategii soupeře. To vede k problému lineárního programování s optimálními strategiemi pro každého hráče. Touto minimaxovou metodou lze vypočítat pravděpodobně optimální strategie pro všechny hry dvou hráčů s nulovým součtem.

Ve výše uvedeném příkladu se ukazuje, že červený by měl zvolit akci 1 s pravděpodobností 4/7 a akci 2 s pravděpodobností 3/7 a modrý by měl třem akcím A, B a C přiřadit pravděpodobnosti 0, 4/7 a 3/7. To znamená, že červený by měl zvolit akci 1 s pravděpodobností 4/7 a akci 2 s pravděpodobností 3/7. Červený pak vyhraje v průměru 20/7 bodů za hru.

ŘešeníUpravit

Nashovu rovnováhu pro hru dvou hráčů s nulovým součtem lze nalézt řešením úlohy lineárního programování. Předpokládejme, že hra s nulovým součtem má matici výplat M, kde prvek Mi,j je výplata získaná, když minimalizující hráč zvolí čistou strategii i a maximalizující hráč zvolí čistou strategii j (tj. hráč, který se snaží minimalizovat výplatu, zvolí řádek a hráč, který se snaží maximalizovat výplatu, zvolí sloupec). Předpokládejme, že každý prvek M je kladný. Hra bude mít alespoň jedno Nashovo ekvilibrium. Nashovu rovnováhu lze nalézt (Raghavan 1994, s. 740) řešením následujícího lineárního programu pro nalezení vektoru u:

Minimalizovat: ∑ i u i {\displaystyle \sum _{i}u_{i}}. S výhradou omezení: u ≥ 0 M u ≥ 1.

První omezení říká, že každý prvek vektoru u musí být nezáporný, a druhé omezení říká, že každý prvek vektoru M u musí být alespoň 1. Pro výsledný vektor u platí, že inverzní hodnota součtu jeho prvků je hodnotou hry. Vynásobením u touto hodnotou získáme vektor pravděpodobnosti, který udává pravděpodobnost, že maximalizující hráč zvolí každou z možných čistých strategií.

Pokud matice hry nemá všechny kladné prvky, stačí ke každému prvku přičíst konstantu, která je dostatečně velká, aby byly všechny kladné. To zvýší hodnotu hry o tuto konstantu a nebude mít žádný vliv na rovnovážné smíšené strategie pro rovnováhu.

Rovnovážnou smíšenou strategii pro minimalizujícího hráče lze najít řešením duálu daného lineárního programu. Nebo ji lze nalézt pomocí výše uvedeného postupu řešení modifikované matice výplat, která je transpozicí a negací M (přidáním konstanty, aby byla kladná), a následným řešením výsledné hry.

Pokud jsou nalezena všechna řešení lineárního programu, budou tvořit všechna Nashova ekvilibria pro danou hru. Naopak jakýkoli lineární program lze převést na hru s nulovým součtem pro dva hráče pomocí změny proměnných, která jej uvede do tvaru výše uvedených rovnic. Takové hry jsou tedy obecně ekvivalentní lineárním programům.

Univerzální řešeníUpravit

Je-li vyhýbání se hře s nulovým součtem akční volbou s určitou pravděpodobností pro hráče, je vyhýbání se vždy rovnovážnou strategií alespoň pro jednoho hráče ve hře s nulovým součtem. Pro jakoukoli hru dvou hráčů s nulovým součtem, kde je nulový tah po zahájení hry nemožný nebo nevěrohodný, jako je například poker, neexistuje jiná Nashova rovnovážná strategie než vyhýbání se hře. I když po zahájení hry s nulovým součtem existuje věrohodná nulová remíza, není lepší než strategie vyhýbání se. V tomto smyslu je zajímavé zjištění, že odměna za hru při výpočtu optimální volby převáží nad všemi hrami s nulovým součtem dvou hráčů s ohledem na zahájení či nezahájení hry.

Nejběžnějším či nejjednodušším příkladem z podoboru sociální psychologie je pojem „sociální pasti“. V některých případech může sledování individuálního osobního zájmu zvýšit kolektivní blahobyt skupiny, ale v jiných situacích vede sledování osobního zájmu všech stran k vzájemně destruktivnímu chování.

SložitostEdit

To teoretizoval Robert Wright ve své knize Nonzero: Wright v knize The Logic of Human Destiny (Logika lidského osudu) uvádí, že společnost se stává stále více nenulovou s tím, jak se stává složitější, specializovanější a vzájemně závislejší.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.