ゼロサム・ゲーム

2人の有限ゼロサム・ゲームでは、ナッシュ均衡、ミニマックス、マキシミンという異なるゲーム理論の解の概念がすべて同じ解を与える。 プレイヤーが混合戦略をとることが許される場合、そのゲームは常に均衡を持つ。

ExampleEdit

ゼロ和のゲーム。和ゲーム
Blue
Red
A B C
1
-30
30
10
-10
-20
20
2
10
-10
-20
20
20
-20

ゲームのペイオフ行列は便利な表現である。 たとえば、右または上の写真の2人用ゼロサムゲームを考えてみましょう。

プレイの順序は次のように進みます。 最初のプレイヤー(赤)は2つの行動1または2のいずれかを秘密裏に選択し、2番目のプレイヤー(青)は最初のプレイヤーの選択を知らずに、3つの行動A、B、Cのいずれかを秘密裏に選択します。その後、選択が明らかになり、各プレイヤーの得点合計はこれらの選択に対する報酬に応じて影響を受けます

例 ペイオフが配分されると、赤は20点、青は20点を失います。

このゲーム例では、両方のプレイヤーがペイオフマトリクスを知っていて、自分の点数を最大化しようとします。 赤は次のように推論することができる。 “行動2では20点まで失う可能性があり、20点までしか勝てない。行動1では10点しか失わないが30点まで勝てるので、行動1の方がずっと良さそうだ。” 同じような理由で青は行動 C を選んだ. もし青が赤の推理と行動 1 の選択を予期していれば,青は行動 B を選んで 10 点獲得することができる.

エミール・ボレルとジョン・フォン・ノイマンは、確率がこの難問を解決する方法を提供するという基本的な洞察を得た。 2人のプレーヤーは取るべき行動を明確に決めるのではなく、それぞれの行動に確率を割り当て、その確率に従って行動を選択するランダム装置を使用するのである。 各プレイヤーは、相手の戦略に依存しない最大期待点損失を最小化するように、確率を計算する。 これは、各プレイヤーの最適な戦略による線形計画問題につながる。 このミニマックス法はすべての2人零和ゲームについておそらく最適戦略を計算できる。

上の例では、赤は確率4/7で行動1を、確率3/7で行動2を選び、青は3つの行動A、B、Cに確率0、4/7、3/7を割り当てるべきであることがわかる。

SolvingEdit

2人用ゼロ和ゲームのナッシュ均衡は線形計画問題を解くことによって見つけられる。 ゼロサムゲームにペイオフ行列Mがあり、要素Mi,jは最小化プレイヤーが純粋戦略iを、最大化プレイヤーが純粋戦略jを選択したときのペイオフ(すなわち、ペイオフを最小化しようとするプレイヤーが行、最大化しようとするプレイヤーが列を選択する)であるとする。 Mのすべての要素が正であると仮定する。 このゲームには少なくとも1つのナッシュ均衡が存在することになる。 ナッシュ均衡は次の線形プログラムを解いてベクトルu:

を求めればよい(Raghavan 1994, p. 740)。 ∑ i u i {displaystyle \sum _{i}u_{i}}} を満たす。 制約条件:u≧0 M u≧1。

最初の制約では、uベクトルの各要素は非負でなければならず、2番目の制約では、M uベクトルの各要素は少なくとも1でなければならないとしています。 結果として得られるuベクトルについて、その要素の和の逆数がゲームの値となる。 uにその値を掛けると確率ベクトルとなり、最大化するプレイヤーが可能な純粋戦略のそれぞれを選択する確率を与える。

ゲーム行列がすべて正の要素を持っていない場合は、すべての要素がすべて正になるように十分大きな定数を追加すればよい。 それはゲームの値をその定数だけ増加させ、均衡の混合戦略に影響を与えない。

最小化するプレイヤーの均衡混合戦略は、与えられた線形プログラムの双対を解くことによって見つけることができる。 あるいは、上記の手順でMの転置と否定である修正ペイオフ行列を解き(正になるように定数を加える)、その結果のゲームを解けば見つかる。

線形プログラムの解がすべて見つかれば、それがそのゲームのすべてのナッシュ均衡を構成することになる。 逆に、どんな線形プログラムでも、変数を変えて上の式の形にすれば、二人用のゼロサムゲームに変換することができる。 168>

Universal solutionEdit

ゼロサム・ゲームの回避がプレイヤーにとってある確率の行動選択であれば、回避はゼロサム・ゲームにおいて少なくとも一人のプレイヤーにとって常に均衡戦略である。 ポーカーのようにプレイ開始後にゼロゼロの引き分けが不可能、あるいは信用できない2人のゼロサムゲームでは、プレイを回避する以外にナッシュ均衡戦略は存在しない。 ゼロサムゲーム開始後に信憑性のあるゼロゼロ引きがあったとしても、回避戦略より優れているとは言えない。 この意味で、最適選択計算における報酬型は、ゲームを始めるかどうかに関して、すべての二人用ゼロサム・ゲームに勝たなければならないというのは興味深い。

社会心理学の下位分野から最も一般的または単純な例として、「社会の罠」という考え方がある。 また、”Social Traps “とは、「社会的な罠」という意味で、個人の利益を追求することが集団の幸福を高める場合もあれば、すべての関係者が個人の利益を追求した結果、相互に破壊的な行動をとる場合もある。 社会がより複雑になり、専門化し、相互依存が進むにつれて、社会はますます非ゼロサムになると、彼の著書『Nonzero: The Logic of Human Destiny』では理論づけられています。

コメントを残す

メールアドレスが公開されることはありません。