Juego de suma cero

Para los juegos de suma cero finitos de dos jugadores, los diferentes conceptos de solución de la teoría de juegos de equilibrio de Nash, minimax y maximin dan todos la misma solución. Si se permite a los jugadores jugar una estrategia mixta, el juego siempre tiene un equilibrio.

EjemploEditar

Un juego de suma cerojuego de suma
Azul
Rojo
A B C
1
-30
30
10
-10
-20
20
2
10
-10
-20
20
20
-20

La matriz de pagos de un juego es una representación conveniente. Consideremos, por ejemplo, el juego de suma cero para dos jugadores que se muestra a la derecha o arriba.

El orden de juego procede como sigue: El primer jugador (rojo) elige en secreto una de las dos acciones 1 o 2; el segundo jugador (azul), sin conocer la elección del primero, elige en secreto una de las tres acciones A, B o C. A continuación, se revelan las elecciones y el total de puntos de cada jugador se ve afectado de acuerdo con el pago de esas elecciones.

Ejemplo: El rojo elige la acción 2 y el azul la acción B. Cuando se asigna la retribución, el rojo gana 20 puntos y el azul pierde 20 puntos.

En este juego de ejemplo, ambos jugadores conocen la matriz de retribución e intentan maximizar el número de sus puntos. El rojo podría razonar de la siguiente manera: «Con la acción 2, podría perder hasta 20 puntos y puedo ganar sólo 20, y con la acción 1 puedo perder sólo 10 pero puedo ganar hasta 30, así que la acción 1 parece mucho mejor». Con un razonamiento similar, Azul elegiría la acción C. Si ambos jugadores realizan estas acciones, Rojo ganará 20 puntos. Si el Azul se anticipa al razonamiento del Rojo y a la elección de la acción 1, el Azul puede elegir la acción B, para ganar 10 puntos. Si el rojo, a su vez, se anticipa a este truco y opta por la acción 2, el rojo ganará 20 puntos.

Émile Borel y John von Neumann tuvieron la idea fundamental de que la probabilidad proporciona una salida a este enigma. En lugar de decidir una acción definida, los dos jugadores asignan probabilidades a sus respectivas acciones, y luego utilizan un dispositivo aleatorio que, de acuerdo con estas probabilidades, elige una acción para ellos. Cada jugador calcula las probabilidades para minimizar la máxima pérdida de puntos esperada, independientemente de la estrategia del adversario. Esto conduce a un problema de programación lineal con las estrategias óptimas para cada jugador. Este método minimax puede calcular las estrategias probablemente óptimas para todos los juegos de suma cero de dos jugadores.

Para el ejemplo dado anteriormente, resulta que el Rojo debe elegir la acción 1 con probabilidad 4/7 y la acción 2 con probabilidad 3/7, y el Azul debe asignar las probabilidades 0, 4/7 y 3/7 a las tres acciones A, B y C. El rojo ganará entonces 20/7 puntos de media por partida.

ResolverEditar

El equilibrio de Nash para un juego de suma cero de dos jugadores se puede encontrar resolviendo un problema de programación lineal. Supongamos que un juego de suma cero tiene una matriz de pagos M donde el elemento Mi,j es el pago obtenido cuando el jugador que minimiza elige la estrategia pura i y el jugador que maximiza elige la estrategia pura j (es decir, el jugador que intenta minimizar el pago elige la fila y el jugador que intenta maximizar el pago elige la columna). Supongamos que cada elemento de M es positivo. El juego tendrá al menos un equilibrio de Nash. El equilibrio de Nash se puede encontrar (Raghavan 1994, p. 740) resolviendo el siguiente programa lineal para encontrar un vector u:

Minimizar: ∑ i u i {{displaystyle \\\\Nsum _{i}u_{i}} Sujeto a las restricciones: u ≥ 0 M u ≥ 1.

La primera restricción dice que cada elemento del vector u debe ser no negativo, y la segunda restricción dice que cada elemento del vector M u debe ser al menos 1. Para el vector u resultante, la inversa de la suma de sus elementos es el valor del juego. Multiplicando u por ese valor se obtiene un vector de probabilidades, que da la probabilidad de que el jugador maximizador elija cada una de las posibles estrategias puras.

Si la matriz del juego no tiene todos los elementos positivos, basta con añadir una constante a cada elemento que sea lo suficientemente grande como para que todos sean positivos. Eso aumentará el valor del juego en esa constante, y no tendrá ningún efecto sobre las estrategias mixtas de equilibrio para el equilibrio.

La estrategia mixta de equilibrio para el jugador minimizador se puede encontrar resolviendo el dual del programa lineal dado. O bien, se puede encontrar utilizando el procedimiento anterior para resolver una matriz de pagos modificada que es la transposición y la negación de M (añadiendo una constante para que sea positiva), y luego resolver el juego resultante.

Si se encuentran todas las soluciones del programa lineal, constituirán todos los equilibrios de Nash para el juego. A la inversa, cualquier programa lineal puede convertirse en un juego de suma cero para dos jugadores mediante un cambio de variables que lo ponga en la forma de las ecuaciones anteriores. Así que tales juegos son equivalentes a los programas lineales, en general.

Solución universalEditar

Si evitar un juego de suma cero es una elección de acción con cierta probabilidad para los jugadores, evitar es siempre una estrategia de equilibrio para al menos un jugador en un juego de suma cero. Para cualquier juego de suma cero de dos jugadores en el que un empate a cero es imposible o no creíble una vez iniciada la jugada, como el póquer, no hay ninguna estrategia de equilibrio de Nash que no sea evitar la jugada. Incluso si hay un empate cero-cero creíble después de que se inicie un juego de suma cero, no es mejor que la estrategia de evitar. En este sentido, es interesante encontrar que la recompensa en el cálculo de la elección óptima prevalecerá sobre todos los juegos de suma cero de dos jugadores con respecto a iniciar el juego o no.

El ejemplo más común o simple del subcampo de la psicología social es el concepto de «trampas sociales». En algunos casos, perseguir el interés personal individual puede mejorar el bienestar colectivo del grupo, pero en otras situaciones todas las partes que persiguen el interés personal dan lugar a un comportamiento mutuamente destructivo.

ComplejidadEditar

Se ha teorizado por Robert Wright en su libro Nonzero: The Logic of Human Destiny, que la sociedad se vuelve cada vez más distinta de cero a medida que se vuelve más compleja, especializada e interdependiente.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.