Jogo de soma zero

Para jogos de soma zero finitos para dois jogadores, os diferentes conceitos teóricos de solução de equilíbrio de Nash, minimax, e maximin dão todos a mesma solução. Se aos jogadores for permitido jogar uma estratégia mista, o jogo tem sempre um equilíbrio.

ExampleEdit

A zero-soma do jogo
Azul
Vermelho
A B C
1
−30
30
10
−10
−20
20
2
10
−10
−20
20
20
-20

Uma matriz de payoff do jogo é uma representação conveniente. Considere, por exemplo, o jogo de soma zero para dois jogadores retratado à direita ou acima.

A ordem de jogo procede da seguinte forma: O primeiro jogador (vermelho) escolhe em segredo uma das duas ações 1 ou 2; o segundo jogador (azul), desconhecendo a escolha do primeiro, escolhe em segredo uma das três ações A, B ou C. Então, as escolhas são reveladas e o total de pontos de cada jogador é afetado de acordo com o payoff dessas escolhas.

Exemplo: Vermelho escolhe a ação 2 e Azul escolhe a ação B. Quando o payoff é alocado, Vermelho ganha 20 pontos e Azul perde 20 pontos.

Neste exemplo de jogo, ambos os jogadores conhecem a matriz de payoff e tentam maximizar o número de seus pontos. O Vermelho pode raciocinar da seguinte forma: “Com a acção 2, posso perder até 20 pontos e posso ganhar apenas 20, e com a acção 1 posso perder apenas 10 mas posso ganhar até 30, por isso a acção 1 parece muito melhor.” Com um raciocínio semelhante, o Azul escolheria a acção C. Se ambos os jogadores tomarem estas acções, o Vermelho ganhará 20 pontos. Se o Azul antecipa o raciocínio do Vermelho e a escolha da acção 1, o Azul pode escolher a acção B, de modo a ganhar 10 pontos. Se o Vermelho, por sua vez, antecipa este truque e vai para a acção 2, ganha o Vermelho 20 pontos.

Émile Borel e John von Neumann tiveram a percepção fundamental de que a probabilidade proporciona uma saída para este enigma. Ao invés de decidir sobre uma ação definitiva a ser tomada, os dois jogadores atribuem probabilidades às suas respectivas ações, e então usam um dispositivo aleatório que, de acordo com essas probabilidades, escolhe uma ação para eles. Cada jogador calcula as probabilidades de modo a minimizar a perda de pontos máxima esperada, independentemente da estratégia do adversário. Isto leva a um problema de programação linear com as estratégias ótimas para cada jogador. Este método minimax pode computar estratégias provavelmente ótimas para todos os jogos de dois jogadores de soma zero.

Para o exemplo dado acima, acontece que Vermelho deve escolher a ação 1 com probabilidade 4/7 e a ação 2 com probabilidade 3/7, e Azul deve atribuir as probabilidades 0, 4/7 e 3/7 para as três ações A, B e C. Red então ganhará 20/7 pontos em média por jogo.

SolvingEdit

O equilíbrio de Nash para um jogo de dois jogadores, soma zero pode ser encontrado resolvendo um problema de programação linear. Suponha que um jogo de soma zero tem uma matriz de payoff M onde o elemento Mi,j é o payoff obtido quando o jogador minimizador escolhe estratégia pura i e o jogador maximizador escolhe estratégia pura j (isto é, o jogador que tenta minimizar o payoff escolhe a linha e o jogador que tenta maximizar o payoff escolhe a coluna). Assumir que cada elemento de M é positivo. O jogo terá pelo menos um equilíbrio de Nash. O equilíbrio de Nash pode ser encontrado (Raghavan 1994, p. 740) resolvendo o seguinte programa linear para encontrar um vector u:

Minimizar: ∑ i u i {\i}displaystyle {\i}sum _{i}u_{i}} Sujeito às restrições: u ≥ 0 M u ≥ 1.

A primeira restrição diz que cada elemento do vector u deve ser não negativo, e a segunda restrição diz que cada elemento do vector M u deve ser pelo menos 1. Para o vector u resultante, o inverso da soma dos seus elementos é o valor do jogo. Multiplicar u por esse valor dá um vetor de probabilidade, dando a probabilidade do jogador maximizador escolher cada uma das possíveis estratégias puras.

Se a matriz do jogo não tiver todos os elementos positivos, basta adicionar uma constante a cada elemento que seja grande o suficiente para torná-los todos positivos. Isso irá aumentar o valor do jogo por essa constante, e não terá efeito nas estratégias mistas de equilíbrio para o equilíbrio.

A estratégia mista de equilíbrio para o jogador minimizador pode ser encontrada resolvendo a dupla do programa linear dado. Ou, ela pode ser encontrada usando o procedimento acima para resolver uma matriz de payoff modificada que é a transposição e negação de M (adicionando uma constante para que ela seja positiva), então resolvendo o jogo resultante.

Se todas as soluções para o programa linear forem encontradas, elas constituirão todos os equilíbrios de Nash para o jogo. Por outro lado, qualquer programa linear pode ser convertido em um jogo de dois jogadores, de soma zero, usando uma mudança de variáveis que o coloca na forma das equações acima. Então tais jogos são equivalentes a programas lineares, em geral.

Solução UniversalEditar

Se evitar um jogo de soma zero é uma escolha de ação com alguma probabilidade para os jogadores, evitar é sempre uma estratégia de equilíbrio para pelo menos um jogador em um jogo de soma zero. Para qualquer jogo de dois jogadores com soma zero onde um empate zero é impossível ou não credível após o jogo ser iniciado, como o poker, não há outra estratégia de equilíbrio de Nash além de evitar o jogo. Mesmo que haja um empate credível de zero zero depois de um jogo de soma zero ser iniciado, não é melhor que a estratégia de evitar o jogo. Neste sentido, é interessante encontrar o “reward-as-you-go” no cálculo da escolha óptima deve prevalecer sobre todos os dois jogadores jogos de soma zero em relação ao início ou não do jogo.

O exemplo mais comum ou simples do sub-campo da psicologia social é o conceito de “armadilhas sociais”. Em alguns casos, buscar o interesse pessoal individual pode aumentar o bem-estar coletivo do grupo, mas em outras situações todas as partes que buscam o interesse pessoal resultam em comportamentos mutuamente destrutivos.

ComplexityEdit

Foi teorizado por Robert Wright em seu livro Nonzero: A Lógica do Destino Humano, que a sociedade se torna cada vez mais não-zero à medida que se torna mais complexa, especializada e interdependente.

Deixe uma resposta

O seu endereço de email não será publicado.