Teoría de Juegos de Suma Cero: Estrategias Puras, Mixtas y Optimización

Clasificado en Matemáticas

Escrito el en español con un tamaño de 4,88 KB

Estrategias Puras y Mixtas en Juegos de Suma Cero

Estrategias Puras

En el estudio de las estrategias puras, el procedimiento inicial consiste en calcular el mínimo de cada fila y, de esos valores mínimos, seleccionar el máximo (criterio maximin). Paralelamente, se calculan los máximos de cada columna y, de estos, se elige el mínimo (criterio minimax).

Si ambos valores coinciden, la solución indica que se sigue una estrategia pura con un punto de silla o valor de juego (X), considerándose el juego como estrictamente determinado. Las estrategias óptimas para cada jugador se definen de la siguiente manera:

  • Po (J1): Se representa como un vector (0, 0, 0, 0) donde se coloca un 1 en la posición correspondiente al punto de silla.
  • Qo (J2): Se procede de igual forma, pero aplicando la transpuesta.

En este escenario, se concluye que el Jugador 1 (J1) gana X, mientras que el Jugador 2 (J2) los pierde.

Estrategias Mixtas

Cuando no existe un punto de silla, se recurre a las estrategias mixtas siguiendo estos pasos de simplificación:

  1. Simplificación por filas: Se identifica la fila que tenga los valores menores en comparación con otra. La fila con valores menores se denomina recesiva y se elimina, ya que está dominada por la otra.
  2. Simplificación por columnas: Se aplica el mismo criterio, pero eliminando la columna que posea los mayores valores (ya que el J2 busca minimizar su pérdida).
  3. Iteración: Se repiten los apartados 1 y 2 hasta que no sea posible reducir más la matriz.

Resolución para Matrices 2x2

Si tras la reducción obtenemos una matriz A de la forma:

A = (a11, a12 // a21, a22)

Aplicamos las siguientes fórmulas para hallar las estrategias óptimas:

  • Po: ((a22 - a21) / (a11 + a22 - a12 - a21), (a11 - a12) / (a11 + a22 - a12 - a21))
  • Qo: ((a22 - a12) / (a11 + a22 - a12 - a21), (a11 - a21) / (a11 + a22 - a12 - a21))T
  • Valor de juego (v): (a11 * a22 - a12 * a21) / (a11 + a22 - a12 - a21)

Nota: La suma de las probabilidades dentro de los paréntesis debe ser igual a 1.

Resolución mediante Programación Lineal (Método Simplex)

Cuando, tras reducir la matriz, esta sigue siendo mayor de 2x2, se plantea un problema de optimización:

Maximizar: X1 + X2 + ...
Sujeto a (s.a.): Los valores de la matriz multiplicados por las variables deben ser <= 1, con x1, x2... >= 0.

Posteriormente, se igualan las restricciones a 1 añadiendo las variables de holgura (s1, s2...) y se aplica el algoritmo Simplex:

  1. Elegir la columna con el indicador más positivo.
  2. Elegir el pivote y realizar las operaciones elementales de fila.
  3. Iterar hasta que todos los indicadores sean negativos o cero.

Al finalizar, si el resultado de la función objetivo es 1/v (por ejemplo, 1/v = 2/5), entonces el valor del juego es v = 5/2. Las estrategias se calculan como:

  • Qo = v * XiT
  • Po = v * Yi

Conclusión: El J1 gana 5/2 mientras el J2 los pierde. Esto implica, por ejemplo, que de cada 2 veces, el J2 sigue 1 vez la estrategia E1* y otra vez la E2*, nunca la E3* (y análogamente para el J1).

Optimización Multiobjetivo y Puntos Eficientes

  1. Construcción del conjunto: Se construye el conjunto poligonal convexo factible mediante una representación gráfica.
  2. Tabla de puntos: Se elabora una tabla con los puntos de esquina (P) y sus transformados. Si P = (x, y), entonces su transformado es f(P) = (f1(x,y), f2(x,y)). De los puntos transformados, se busca el mayor valor.
  3. Identificación de puntos eficientes: Se determinan aquellos puntos que no pueden ser mejorados en un objetivo sin empeorar el otro.
  4. Conclusión: El conjunto de puntos eficientes se define mediante la combinación lineal xy = (1 - t)x + ty, con t ∈ (0, 1). Si los puntos x e y son eficientes, el conjunto de puntos eficientes está formado por el segmento o arista xy.

Entradas relacionadas: