Nollasummapeli

Kahden pelaajan äärellisissä nollasummapeleissä eri peliteoreettiset ratkaisukäsitteet Nashin tasapaino, minimax ja maximin antavat kaikki saman ratkaisun. Jos pelaajien sallitaan pelata sekastrategiaa, pelillä on aina tasapaino.

ExampleEdit

Nollanollanollanollanollanollanollanollanollanollanollanollanollanollanollasummapeli
Sininen
Punainen
A B C
1
-30
30
10
-10
-20
20
2
10
-10
-20
20
20
-20

Pelin voittomatriisi on kätevä esitys. Tarkastellaan esimerkiksi oikealla tai yllä kuvattua kahden pelaajan nollasummapeliä.

Pelijärjestys etenee seuraavasti: Ensimmäinen pelaaja (punainen) valitsee salassa jommankumman kahdesta teosta 1 tai 2. Toinen pelaaja (sininen), joka ei tiedä ensimmäisen pelaajan valinnasta, valitsee salassa jommankumman kolmesta teosta A, B tai C. Sitten valinnat paljastetaan, ja kummankin pelaajan pistemäärään vaikuttaa näiden valintojen voittoprosentti.

Esimerkki: Punainen valitsee toiminnon 2 ja sininen toiminnon B. Kun voitto jaetaan, punainen saa 20 pistettä ja sininen menettää 20 pistettä.

Tässä esimerkkipelissä molemmat pelaajat tietävät voittomatriisin ja pyrkivät maksimoimaan pistemääränsä. Punainen voisi järkeillä seuraavasti: ”Toiminnolla 2 voin menettää jopa 20 pistettä ja voin voittaa vain 20, ja toiminnolla 1 voin menettää vain 10, mutta voin voittaa jopa 30, joten toiminta 1 näyttää paljon paremmalta.” Sininen valitsisi vastaavalla tavalla toiminnan C. Jos molemmat pelaajat tekevät nämä toiminnot, punainen voittaa 20 pistettä. Jos sininen ennakoi punaisen päättelyä ja valitsee toiminnan 1, sininen voi valita toiminnan B, jolloin hän voittaa 10 pistettä. Jos Punainen puolestaan ennakoi tämän tempun ja valitsee teon 2, tämä voittaa Punaiselle 20 pistettä.

Émile Borel ja John von Neumann saivat perustavanlaatuisen oivalluksen siitä, että todennäköisyys tarjoaa ulospääsyn tästä pulmasta. Sen sijaan, että kaksi pelaajaa päättäisivät, mihin tiettyyn toimintaan he ryhtyvät, he asettavat todennäköisyyksiä omille toimilleen ja käyttävät sitten satunnaislaitetta, joka näiden todennäköisyyksien mukaan valitsee heille toimen. Kumpikin pelaaja laskee todennäköisyydet siten, että se minimoi suurimman odotettavissa olevan pistemenetyksen vastustajan strategiasta riippumatta. Tämä johtaa lineaariseen ohjelmointiongelmaan, jossa kullekin pelaajalle määritetään optimaaliset strategiat. Tällä minimax-menetelmällä voidaan laskea todennäköisesti optimaaliset strategiat kaikille kahden pelaajan nollasummapeleille.

Yllä annetussa esimerkissä käy ilmi, että punaisen tulisi valita toiminta 1 todennäköisyydellä 4/7 ja toiminta 2 todennäköisyydellä 3/7, ja sinisen tulisi antaa kolmelle toiminnolle A, B ja C todennäköisyydet 0, 4/7 ja 3/7. Punainen voittaa tällöin keskimäärin 20/7 pistettä per peli.

RatkaisuEdit

Kahden pelaajan nollasummapelin Nash-tasapaino voidaan löytää ratkaisemalla lineaarinen ohjelmointiongelma. Oletetaan, että nollasummapelissä on voittomatriisi M, jonka elementti Mi,j on voitto, joka saadaan, kun minimoiva pelaaja valitsee puhtaan strategian i ja maksimoiva pelaaja valitsee puhtaan strategian j (ts. pelaaja, joka yrittää minimoida voittoa, valitsee rivin ja pelaaja, joka yrittää maksimoida voittoa, valitsee sarakkeen). Oletetaan, että jokainen M:n alkio on positiivinen. Pelillä on ainakin yksi Nash-tasapaino. Nash-tasapaino voidaan löytää (Raghavan 1994, s. 740) ratkaisemalla seuraava lineaarinen ohjelma vektorin u löytämiseksi:

Minimoi: ∑ i u i {\displaystyle \sum _{i}u_{i}} Rajoitusten mukaisesti: u ≥ 0 M u ≥ 1.

Ensimmäisen rajoituksen mukaan u-vektorin jokaisen alkion on oltava ei-negatiivinen, ja toisen rajoituksen mukaan M u-vektorin jokaisen alkion on oltava vähintään 1. Tuloksena saadun u-vektorin osalta sen alkioiden summan käänteisluku on pelin arvo. Kertomalla u tällä arvolla saadaan todennäköisyysvektori, joka antaa todennäköisyyden sille, että maksimoiva pelaaja valitsee kunkin mahdollisen puhtaan strategian.

Jos pelimatriisissa ei ole kaikkia positiivisia alkioita, lisätään yksinkertaisesti jokaiseen alkioon vakio, joka on tarpeeksi suuri, jotta kaikki alkioista olisivat positiivisia. Tämä kasvattaa pelin arvoa kyseisellä vakiolla, eikä sillä ole vaikutusta tasapainon sekastrategioihin tasapainossa.

Miinimoivan pelaajan tasapainon sekastrategia voidaan löytää ratkaisemalla annetun lineaarisen ohjelman duaali. Tai se voidaan löytää ratkaisemalla edellä mainittua menettelyä käyttäen muunnettu voittomatriisi, joka on M:n transponointi ja negaatio (lisäämällä vakio, jotta se on positiivinen), ja ratkaisemalla sitten tuloksena oleva peli.

Jos kaikki lineaarisen ohjelman ratkaisut löydetään, ne muodostavat kaikki pelin Nash-tasapainot. Kääntäen mikä tahansa lineaarinen ohjelma voidaan muuntaa kahden pelaajan nollasummapeliksi muuttamalla muuttujia siten, että se saadaan yllä olevien yhtälöiden muotoon. Tällaiset pelit ovat siis yleisesti ottaen ekvivalentteja lineaaristen ohjelmien kanssa.

YleisratkaisuEdit

Jos nollasummapelin välttäminen on pelaajille jollakin todennäköisyydellä tapahtuva toimintavalinta, välttäminen on aina vähintään yhden pelaajan tasapainostrategia nollasummapelissä. Missä tahansa kahden pelaajan nollasummapelissä, jossa nolla-nolla-arvonta on mahdotonta tai epäuskottavaa pelin aloittamisen jälkeen, kuten pokerissa, ei ole muuta Nash-tasapainostrategiaa kuin pelin välttäminen. Vaikka nollasummapelin aloittamisen jälkeen olisikin olemassa uskottava nolla-nolla-arvonta, se ei ole parempi kuin välttämisstrategia. Tässä mielessä on mielenkiintoista havaita, että optimaalisen valinnan laskennassa reward-as-you-go vallitsee kaikissa kahden pelaajan nollasummapeleissä sen suhteen, aloitetaanko peli vai ei.

Yleisin tai yksinkertaisin esimerkki sosiaalipsykologian osa-alueelta on käsite ”sosiaaliset ansat”. Joissakin tapauksissa yksilön henkilökohtaisen edun tavoittelu voi lisätä ryhmän kollektiivista hyvinvointia, mutta toisissa tilanteissa kaikkien osapuolten henkilökohtaisen edun tavoittelu johtaa toisiaan tuhoavaan käyttäytymiseen.

KompleksisuusEdit

Sen on teoretisoinut Robert Wright kirjassaan Nonzero: The Logic of Human Destiny (Ihmisen kohtalon logiikka), että yhteiskunta muuttuu yhä enemmän ei-nollasummaksi, kun se muuttuu monimutkaisemmaksi, erikoistuneemmaksi ja riippuvaisemmaksi toisistaan.

Vastaa

Sähköpostiosoitettasi ei julkaista.