CHAPTER 6: ANALYSIS AND FINDINGS: ESTER
6.2 Ester in context
Volvamos sobre la definiciΓ³n de Estrategias Mixtas presentada en la p.4 supra:
Sea ππ = {π π1, π π2, β― , π ππ } el conjunto de estrategias puras del i-Γ©simo jugador. Entonces, una estrategia mixta para este jugador es una loterΓa βes decir una distribuciΓ³n de probabilidadesβ, ππ = (ππ1, ππ2, β― , πππ) sobre los elementos de ππ esto es, a cada distribuciΓ³n de probabilidades sobre ππ = {π π1, π π2, β― , π ππ }, donde los elementos de ππ son todos no negativos y suman 1
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Al conjunto de las estrategias mixtas del i-Γ©simo jugador se notarΓ‘ con Ξ(ππ) que se define como:
Ξ(ππ) = {ππ = (ππ1, ππ2, β― , πππ): πππ β₯ 0, βπ = 1,2,3, β¦ , π π¦ β πππ = 1
π π=1
}
ο§ Toda estrategia pura es una estrategia mixta: Bajo este tipo de definiciΓ³n una estrategia mixta da probabilidad 1 a una ΓΊnica estrategia y cero a las demΓ‘s. La estrategia pura π ππ es entonces susceptible de ser identificada con la estrategia mixta ππ = (0, 0, β― ,1, β― ,0,0) siendo 1 la j-Γ©sima estrategia pura.
ο§ Para cada estrategia mixta es posible identificar y distinguir al conjunto de estrategias puras que reciben probabilidad estrictamente positiva. Este subconjunto recibe el nombre de Soporte de dicha estrategia (mixta).
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
DefiniciΓ³n.β Soporte de una Estrategia Mixta
Sea ππ = {π π1, π π2, β― , π ππ } el conjunto de estrategias puras del i-Γ©simo jugador. Entonces, el soporte de
una estrategia mixta ππ es el subconjunto de estrategias puras, al cual ππ asigna probabilidades positivas, i.e.
π π’ππ(ππ ) = {π ππ β ππ βΆ ππ(π ππ) > 0 }
ο§ El soporte de una estrategia mixta ππ, π π’ππ(ππ ) β ππ tal que π ππ β π π’ππ(ππ ) β· πππ > 0.
ο§ Se dirΓ‘ que la estrategia mixta ππ es una estrategia mixta completa si dicha estrategia coincide con el conjunto de estrategias puras del jugador, es decir, π π’ππ(ππ ) = ππ.
ο§ Una estrategia mixta es completa si asigna una probabilidad estrictamente positiva a cada estrategia pura de ππ
ο§ Toda estrategia pura es una estrategia mixta de soporte unitario, i.e., un soporte de un ΓΊnico elemento.
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Ejemplo ( PJC: 147 )
Sea el siguiente juego:
Jugador 2
Izquierda Derecha
Jugador 1 Arriba 3, 2 1, 4
Centro 1, 3 2, 1
Abajo 2, 2 2, 0
ο§ Los conjuntos de estrategias puras son: {π1 = [π΄, πΆ, π΅] π2 = [πΌ, π·]
ο§ Una estrategia mixta para el Jugador 1 puede ser una distribuciΓ³n π1 = {π, π, 1 β π β π} donde π
es la probabilidad de elegir Arriba, π es la probabilidad de elegir C, y Abajo se elige con probabilidad
1 β π β π.
ο§ Una estrategia mixta para el Jugador 2 puede ser una distribuciΓ³n π2 = {π, 1 β π} con π siendo la probabilidad de jugar Izquierda mientras que la estrategia Derecha se juega con probabilidad (1 β π).
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
ο Para el Jugador 1, toda estrategia mixta en la que π > 0, π > 0, 1 β π β π > 0 tendrΓ‘ un conjunto soporte π π’ππ(π1 ) igual al nΓΊmero de estrategias puras siendo asΓ una estrategia mixta completa.
ο Una estrategia mixta completa para este jugador es (12,14,1
4), en donde jugar π΄ tiene probabilidad 1 2,
jugar πΆ tiene probabilidad 1
4, y jugar π΅ tiene probabilidad 1
4 tiene un conjunto soporte que coincide
con el conjunto de estrategias puras, π1: π π’ππ(12,14,1 4).
ο En contraste, si una estrategia mixta para el jugador 1 es una loterΓa (0,13,2
3) esta no puede entenderse
como una estrategia mixta completa porque asigna probabilidad 0 a la estrategia pura π΄, y su
soporte es un subconjunto propio de π1: π π’ππ(0,13,2
3) = {π΅, πΆ};
ο Las estrategias puras {π΄, π΅, πΆ} pueden entenderse como las estrategias mixtas:
(1,0,0), (0,1,0), (0,0,1).
ο Bajo estrategias mixtas las funciones de pago dejan de ser determinΓsticas para tornarse en aleatorias;
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Ejemplo: Matching Pennies.β Suponga de nuevo el juego de las monedas. En este caso π1 = π2 = (πΆπππ πππππ) con pagos:
Jugador 2
Cara Sello
Jugador 1 Cara 1, -1 -1, 1
Sello -1, 1 1, -1
Sean π1 = (π, 1 β π) y π2 = (π, 1 β π). Entonces, los pagos esperados para cada jugador son:
ο§ π1((π, 1 β π), πΆπππ) = ππ’1(πΆπππ, πΆπππ) + (1 β π)π’1(πππππ, πΆπππ) = π(1) + (1 β π)(β1) = π β 1 + π = 2π β 1 ο§ π2((π, 1 β π), πΆπππ) = ππ’2(πΆπππ, πΆπππ) + (1 β π)π’2(πππππ, πΆπππ) = π(β1) + (1 β π)(1) = βπ + 1 β π = 1 β 2π En tanto que: ο§ π1((π, 1 β π), πππππ) = ππ’1(πΆπππ, πππππ) + (1 β π)π’1(πππππ, πππππ) = π(β1) + (1 β π)(1) = βπ + 1 β π = 1 β 2π ο§ π2((π, 1 β π), πππππ) = ππ’2(πΆπππ, πππππ) + (1 β π)π’2(πππππ, πππππ) = π(1) + (1 β π)(β1) = π + 1 + π = 2π β 1
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Los pagos esperados al combinar las dos estrategias mixtas son:
π1[π1, π2] = π1[(π, 1 β π) , (π, 1 β π)] = ππ1((π, 1 β π), πΆπππ) + (1 β π)π1((π, 1 β π), πππππ) = π(2π β 1) + (1 β π)(1 β 2π) = 1 β 2π β 2π + 4ππ
π2[π1, π2] = π2[(π, 1 β π) , (π, 1 β π)]
= π β π(β1) + (1 β π) β π β (1) + π β (1 β π)(1) + (1 β π) β (1 β π)(β1) = β1 + 2π + 2π β 4ππ
Suponga ex post que se tienen los siguientes pares de estrategias: ((1 3β , 2 3β ), πΆπππ) y
((1 3β , 2 3β ), (4 5β , 1 5β ))
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Utilidad Esperada en Juegos Bi-persona
Sea Ξ un juego con dos jugadores cuyos conjuntos de estrategias puras son:
π1 = {π 11, π 12, β¦ , π 1π} y π2 = {π 21, π 22, β¦ , π 2π}
Sea ademΓ‘s la estrategia mixta: π2 = {π21, π22, β¦ , π2π}
Si el jugador 1 juega π 1π y el jugador 2 juega π2 las ganancias esperadas para cada jugador serΓ‘n:
π1(π 1π, π2) = π21π’1(π 1π, π 21) + π22π’1(π 1π, π 22) + β― + π2ππ’1(π 1π, π 2π) = β π2ππ’1(π 1π, π 2π) π π=1 π2(π 1π, π2) = π21π’2(π 1π, π 21) + π22π’2(π 1π, π 22) + β― + π2ππ’2(π 1π, π 2π) = β π2ππ’2(π 1π, π 2π) π π=1
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Suponga que el jugador 1 ahora juega π1 = {π11, π12, β¦ , π1π} y el jugador 2 juega π2 = {π21, π22, β¦ , π2π}, las ganancias esperadas serΓ‘n:
π1(π1, π2) = π11π1(π 11, π2) + π12π1(π 12, π2) + β― + π1ππ1(π 1π, π2) = = π11 β π2ππ’1(π 11, π 2π) π π=1 + π12 β π2ππ’1(π 12, π 2π) π π=1 + β― + π1π β π2ππ’1(π 1π, π 2π) π π=1 = β π1π (β π2ππ’1(π 1π, π 2π) π π=1 ) π π=1 = β β π1ππ2ππ’1(π 1π, π 2π) π π=1 π π=1
En tanto que para el Jugador 2:
π2(π1, π2) = π11π2(π 11, π2) + π12π2(π 12, π2) + β― + π1ππ2(π 1π, π2) = = π11β π2ππ’1(π 11, π 2π) π π=1 + π12 β π2ππ’2(π 12, π 2π) π π=1 + β― + π1π β π2ππ’2(π 1π, π 2π) π π=1 = β π1π (β π2ππ’2(π 1π, π 2π) π π=1 ) π π=1 = β β π1ππ2ππ’2(π 1π, π 2π) π π=1 π π=1
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Las Ganancias Esperadas en Forma Matricial:
Considere un juego Ξ con estrategias puras π1 = {π 11, π 12, β¦ , π 1π} y π2 = {π 21, π 22, β¦ , π 2π}, y con estrategias mixtas π1 = {π11, π12, β¦ , π1π} y π2 = {π21, π22, β¦ , π2π}. En tonces, la representaciΓ³n en forma estratΓ©gicas es: Jugador 2 π 21 π 21 β¦ π 2π Jugador 1 π 11 π’1(π 11, π 21), π’2(π 11, π 21) π’1(π 11, π 22), π’2(π 11, π 22) β¦ π’1(π 11, π 2π), π’2(π 11, π 2π) π 12 π’1(π 12, π 21), π’2(π 12, π 21) π’1(π 1Β΄2, π 22), π’2(π 12, π 22) β¦ π’1(π 12, π 2π), π’2(π 12, π 2π) β¦ β¦ β¦ β¦ β¦ π 1π π’1(π 1π, π 21), π’2(π 1π, π 21) π’1(π 1π, π 22), π’2(π 1π, π 22) β¦ π’1(π 1π, π 2π), π’2(π 1π, π 2π)
Sean: π΄1 = (π’1(π 1π, π 2π)) y π΄2 = (π’2(π 1π, π 2π)), que corresponden respectivamente a las submatrices de
ganancias del Jugador 1 y del Jugador 2. Entonces, la ganancia esperada de cada jugador, dadas las estrategias mixtas π1 y π2, son:
π1 = π1π΄1π2 y π2=π1π΄2π2
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Ejemplo (PJC, 2004: 150~): Considere de nuevo el juego,
Jugador 2
Izquierda Derecha
Jugador 1 Arriba 3, 2 1, 4
Centro 1, 3 2, 1
Abajo 2, 2 2, 0
i. Sean π1 = {2 3β , 1 6β , 1 6β } y π2 = {1 3β , 2 3β }. Entonces, dadas:
π΄1 = ( 3 1 1 2 2 2 ) y π΄2 = ( 2 4 3 1 2 0 )
Las ganancias esperadas de jugar las estrategias mixtas propuestas para cada jugador son:
π1 = π1π΄1π2π = (2 3β , 1 6β , 1 6β ) ( 3 1 1 2 2 2 ) (1 3β 1 3β ) = 31 18β
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash π2 = π1π΄2π2π = (2 3β , 1 6β , 1 6β ) ( 2 4 3 1 2 0 ) (1 3β 1 3β ) = 47 18β
ii. Considere ahora el siguiente par de estrategias: π1 = (2 3β , 1 6β , 1 6β ) y π 2 = πΌπ§ππ’πππππ. ΒΏCuΓ‘les son las utilidades esperadas de los Jugadores?
π1(π1, π2) = π1π΄1π2π = (2 3β , 1 6β , 1 6β ) ( 3 1 1 2 2 2 ) (1 0) = (5 2β 4 3β ) ( 1 0) = 5 2β π2(π1, π2) = π1π΄2π2π = (2 3β , 1 6β , 1 6β ) ( 2 4 3 1 2 0 ) (1 0) = (13 6β 17 6β ) ( 1 0) = 31 6β
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
DefiniciΓ³n: Equilibrio de Nash en Estrategias Mixtas:
Sea el Juego Ξ = [π; π1, β¦ , ππ; π’1, β¦ , π’π]. Entonces, se dice que el perfil de estrategias mixtas πβ = (π1β, β¦ , ππβ, β¦ , ππβ) es un Equilibrio de Nash (en estrategias mixtas), si para todo π = 1,2, β¦ , π
ππ(π1β, β¦ , ππβ1β , ππβ, ππ+1β , β¦ , ππβ) β₯ ππ(π1β, β¦ , ππβ1β , ππ, ππ+1β , β¦ , ππβ)
Para todo ππ β Ξ(ππ) = {ππ = (ππ1, ππ2, β― , πππ): πππ β₯ 0, βπ = 1,2,3, β¦ , π π¦ βππ=1πππ = 1}
Esto es, si para todo π = 1,2, β¦ , π resulta que:
ππβ = argmax
ππ
{ππ(π1β, β¦ , ππβ1β , ππ, ππ+1β , β¦ , ππβ)}
O sea, cuando para cada uno de los π = 1,2, β¦ , π jugadores ππβ es respuesta Γ³ptima a πβπβ
ObservaciΓ³n: El pago esperado de una estrategia mixta de un jugador, dadas las estrategias de los demΓ‘s jugadores, es una combinaciΓ³n convexa de los pagos de las estrategias puras soporte de esa estrategia mixta: luego la ganancia esperada de una estrategia mixta debe estar entre las ganancias mΓ‘xima y mΓnima de las estrategias puras soporte del jugador.
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Teorema: Equilibrio de Nash (Ampliado)
Sea el Juego Ξ = [π; π1, β¦ , ππ; π’1, β¦ , π’π] . Se dice que el perfil de estrategias mixtas πβ = (π1β, β¦ , ππβ, β¦ , ππβ) es un Equilibrio de Nash si y solo si para todo π = 1,2, β¦ , π con estrategia mixta ππβ = (ππ1β, ππ2β, β¦ , πππβ, β¦ ) el hecho de que πππβ > 0 implica que π ππ es una respuesta Γ³ptima a πβπβ = (ππβ, β¦ , ππβ1β , ππ+1β β¦ , ππβ ).
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Ejemplo (PJC, 2004: 155~): Considere de nuevo el juego,
Jugador 2
Izquierda Derecha
Jugador 1 Arriba (A) 3, 2 1, 4
Centro (C) 1, 3 2, 1
Abajo (B) 2, 2 2, 0
El juego tiene un ΓΊnico Equilibrio de Nash en estrategias mixtas bajo el perfil [(1 2β , 0, 1 2β ), (1 2β , 1 2β )]: Cualquier estrategia del Jugador 1 con soporte contenido en el conjunto {π΄, π΅} incluidas las estrategias puras π΄ y π΅ es respuesta Γ³ptima a la estrategia mixta del jugador 2, π2β = (1 2β , 1 2β ). Al mismo tiempo, cualquier estrategia, pura o mixta del jugador 2 es respuesta Γ³ptima a la estrategia , π1β = (1 2β , 0, 1 2β ) del Jugador 1.
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
i. Dada la estrategia π2β = (1 2β , 1 2β ) del jugador 2, el jugador 1 obtiene las mismas ganancias al utilizar distintas estrategias con soporte {π΄, π΅}. En efecto,
π1(π1, π2) = π1π΄1π2π = (1 2β , 0, 1 2β ) ( 3 1 1 2 2 2 ) (1 2β 1 2β ) = (5 2β , 3 2β ) ( 1 2β 1 2β ) = 2 π1(π΄, π2) = (1, 0,0) ( 3 1 1 2 2 2 ) (1 2β 1 2β ) = (3,1) ( 1 2β 1 2β ) = 2 π1(π΅, π2) = (0, 0,1) ( 3 1 1 2 2 2 ) (1 2β 1 2β ) = (2,2) ( 1 2β 1 2β ) = 2 π1((1 3β , 0, 2 3β ), π2) = (1 3β , 0, 2 3β ) ( 3 1 1 2 2 2 ) (1 2β 1 2β ) = (7 3β , 5 3β ) ( 1 2β 1 2β ) = 2
En general, dada π2β cualquier estrategia π1 = (π1π, 0, 1 β π1π) de soporte {π΄, π΅} genera ganancia 2 para el jugador 1. Compruebe que:
π1((π1π, 0, 1 β π1π), π2) = ((π1π, 0, 1 β π1π)) ( 3 1 1 2 2 2 ) (1 2β 1 2β ) = (2 + π1 π, 2 β π 1π) ( 1 2β 1 2β ) = 2
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
ii. Dada la estrategia π1β = (1 2β , 0, 1 2β ) las ganancias para el jugador 2 serΓ‘n:
π2(π1β, π2) = π1π΄2π2π = (1 2β , 0, 1 2β ) ( 2 4 3 1 2 0 ) (1 2β 1 2β ) = (2, 2) ( 1 2β 1 2β ) = 2 π2(π1β, πΌ) = π1π΄2π2π = (1 2β , 0, 1 2β ) ( 2 4 3 1 2 0 ) (1 0) = (2, 2) ( 1 0) = 2 π2(π1β, π·) = π1π΄2π2π = (1 2β , 0, 1 2β ) ( 2 4 3 1 2 0 ) (0 1) = (2, 2) ( 0 1) = 2 π2(π1β, (4 5β , 1 5β )) = π1π΄2π2π = (1 2β , 0, 1 2β ) ( 2 4 3 1 2 0 ) (4 5β 1 5β ) = (2, 2) ( 4 5β 1 5β ) = 2 π2(π1β, (π21, 1 β π21)) = π1π΄2π2π = (1 2β , 0, 1 2β ) ( 2 4 3 1 2 0 ) ( π2 1 1 β π21) = (2, 2) ( π21 1 β π21) = 2
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Equilibrios de Nash en Estrategias Mixtas en Juegos 2 Γ 2
Para calcular los Equilibrios de Nash en juegos 2 Γ 2 se usa la siguiente propiedad de las estrategias mixtas:
Una estrategia mixta es respuesta Γ³ptima a otra estrategia pura o mixta determinada, si y solo si sus estrategias puras soporte son respuesta Γ³ptima. Como consecuencia tales estrategias puras producen ganancias iguales y mΓ‘ximas, dada la estrategia del otro jugador (PJC, 2004: 158).
El procedimiento para obtener grΓ‘ficamente los Equilibrios de Nash se resume a continuaciΓ³n (PJC, id.):
i. FΓjense estrategias mixtas genΓ©ricas (π, 1 β π) y (π, 1 β π);
ii. CalcΓΊlese la utilidad esperada que obtiene el jugador 1 de cada estrategia pura cuando la estrategia del jugador 2 es (π, 1 β π);
iii. Seguidamente, calcΓΊlese la correspondencia de respuesta Γ³ptima del Jugador 1, π 1(π);
iv. ProcΓ©dase con el Jugador 2, calculando la utilidad esperada de cada una de las estrategias puras cuando la estrategia del jugador 1 es (π, 1 β π).
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
vi. Represente grΓ‘ficamente las correspondencias π π(β) en el plano π, π. Los Equilibrios de Nash se encuentran en los puntos en los que π 1(π) y π 2(π) se intersecan.
Ejemplo (PJC, 2004: 158~): Matching Pennies. Considere de nuevo el siguiente juego:
Jugador 2
Cara Sello
Jugador 1 Cara 1, -1 -1, 1
Sello -1, 1 1, 1
i. Sean π1 = (π, 1 β π) y π2 = (π, 1 β π)
ii. Fije (π, 1 β π). En el caso del Jugador 1 se tiene:
π1(πΆπππ, (π, 1 β π)) = π(1) + (1 β π)(β1) = 2π β 1
π1(πππππ, (π, 1 β π)) = π(β1) + (1 β π)(1) = 1 β 2π
iii. Se tienen las siguientes situaciones:
π1(πΆπππ, (π, 1 β π)) > π1(πππππ, (π, 1 β π)) β· 2π β 1 > 1 β 2π β· π > 1 2β π1(πΆπππ, (π, 1 β π)) < π1(πππππ, (π, 1 β π)) β· 2π β 1 < 1 β 2π β· π < 1 2β
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash π1(πΆπππ, (π, 1 β π)) = π1(πππππ, (π, 1 β π)) β· 2π β 1 = 1 β 2π β· π = 1 2β
En consecuencia,
ο§ La respuesta Γ³ptima del jugador 1 a cualquier (π, 1 β π) serΓ‘ Cara si π > 1 2β ;
ο§ La respuesta Γ³ptima del jugador 1 a cualquier (π, 1 β π) serΓ‘ Sello si π < 1 2β ;
ο§ La respuesta Γ³ptima del jugador 1 a cualquier (π, 1 β π) serΓ‘ Cara o Sello si π = 1 2β ;
π 1(π) = {
π = 0(π½π’πππ πππππ) β π < 1 2β π = 1(π½π’πππ πΆπππ) β π > 1 2β π β [0,1] β π = 1 2β
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
iv. Fije ahora (π, 1 β π) para el Jugador 1. Calcule los pagos esperados para el Jugador 2. En este caso,
π2((π, 1 β π), πΆπππ) = π(β1) + (1 β π)(1) = 1 β 2π π2((π, 1 β π), πππππ) = π(1) + (1 β π)(β1) = 2π β 1
Se tienen las siguientes situaciones:
ο§ π2((π, 1 β π), πΆπππ) > π2((π, 1 β π), πππππ) β· 1 β 2π > 2π β 1 β· π < 1 2β
ο§ π2((π, 1 β π), πΆπππ) < π2((π, 1 β π), πππππ) β· 1 β 2π < 2π β 1 β· π > 1 2β
ο§ π2((π, 1 β π), πΆπππ) = π2((π, 1 β π), πππππ) β· 1 β 2π = 2π β 1 β· π = 1 2β
En este caso, la correspondencia de respuesta Γ³ptima del Jugador 2 es:
π 2(π) = {
π = 0(π½π’πππ πππππ) β π > 1 2β π = 1(π½π’πππ πΆπππ) β π < 1 2β π β [0,1] β π = 1 2β
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Ejemplo: La Batalla de los Sexos (otra vez!)
Los pagos en este juego son los que aparecen en seguida:
Jugador 2 Cine FΓΊtbol Jugador 1 Cine 1, 2 0, 0
FΓΊtbol 0, 0 2, 1
El juego tiene dos equilibrios de Nash en estrategias puras. Considere para el jugador 2 la estrategia mixta
π2 = (π, 1 β π). El jugador 1 obtiene los siguientes niveles de utilidad para cada una de sus estrategias puras asΓ:
π1(πΆπππ, π2) = (1)π + 0(1 β π) = π
π1(πΉπ’π‘πππ, π2) = (0)π + 2(1 β π) = 2 β 2π
π1(πΆπππ, π2) = π1(πΉπ’π‘πππ, π2) β π = 2 β 2π β π = 2/3
Cuando π = 2/3, J1 es indiferente respecto de sus dos estrategias puras y por lo tanto respecto de cualquiera de sus estrategias mixtas
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
La correspondencia de respuesta Γ³ptima para J1 es:
π 1(π2) = {
π = 1 β π > 2/3 π = 0 β π < 2/3 π β [0,1] β π = 2/3
Ahora considere π1 = (π, 1 β π). Para J2 las ganancias esperadas serΓ‘n:
π2((π, 1 β π), πΆπππ) = 2π + 0(1 β π) = 2π π2((π, 1 β π), πΉπ’π‘πππ) = 0π + 1(1 β π) = 1 β 1π π2((π, 1 β π), πΆπππ) = π2((π, 1 β π), πΉπ’π‘πππ) β 2π = 1 β 1π β π = 1 3 π 2(π1) = { π = 1 β π > 1/3 π = 0 β π < 1/3 π β [0,1] β π = 1/3
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Ejemplo: HalcΓ³n-Paloma (otra vez!)
Dos individuos pueden comportarse de manera agresiva (HalcΓ³n) o pacΓfica (Paloma) por la posesiΓ³n de un objeto de valor, V. Si los dos se comportan en modo agresivo, del conflicto resultante surgirΓ‘n unos costos C. Si ambos se comportan de manera conciliadora, se repartirΓ‘n el objeto. Si uno se comporta en forma pacΓfica y el otro no, el pacΓfico no obtienen nada y el agresivo se quedarΓ‘ con todo. Los pagos en este juego son los que aparecen en seguida:
Jugador 2
Paloma HalcΓ³n
Jugador 1 Paloma π 2β , π 2β 0, π
HalcΓ³n π, 0 π 2β β πΆ, π 2 β πΆβ
Sean π = 2 y πΆ = 4. Los pagos para este juego son:
Jugador 2 HalcΓ³n Paloma Jugador 1 HalcΓ³n 1, 1 0, 2
Paloma 2, 0 -3, -3
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Suponga que para J1 π1 = (π, 1 β π) y que para J2 π1 = (π, 1 β π). Las utilidades esperadas serΓ‘n:
π
1= (π, 1 β π) (
1 0 2 β3) (
π 1 β 1)
= 3π + 5π β 4ππ β 3π
2= (π, 1 β π) (
1 2 0 β3) (
π 1 β 1)
= 5π + 3π β 4ππ β 3El Jugador 1 maximiza su ganancia esperada, i.e., resuelve:
max
π π1 = 3π + 5π β 4ππ β 3
Las condiciones relevantes para Γ³ptimo son:
ππ1
ππ = 3 β 4π = 0 β (π, 1 β π) = (3 4β , 1 4β )
ο§ Note que 3 β 4π < 0 β β4π < β3. Multiplicando ambos lados por (-1) se tiene que si π > 3/4
el beneficio mΓ‘ximo de J1 se torna negativo. Por lo tanto, si π > 3/4, esto es, si J2 juega Paloma, J1 deberΓa hacer π = 0, esto es, deberΓ‘ jugar HalcΓ³n.
ο§ Si 3 β 4π > 0 β π < 3/4 y J1 deberΓ‘ jugar π = 1, i.e., deberΓ‘ jugar paloma.
ο§ Cuando 3 β 4π = 0, π = 3/4 y J1 serΓ‘ indiferente entre jugar HalcΓ³n o Paloma asΓ como respecto
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Por su parte, el Jugador 2 deberΓ‘ resolver:
max
π π2 = 5π + 3π β 4ππ β 3
CPO:
π
π
2ππ = 3 β 4π = 0
ο§ El Jugador 2 deberΓ‘ jugar HalcΓ³n (jugarΓ‘ π = 0), siempre que J1 juegue π > 3/4 (siempre que J1, juegue Paloma);
ο§ El Jugador 2 deberΓ‘ jugar Paloma (jugarΓ‘ π = 1) siempre que J1 juegue π < 3/4 (i.e., siempre que J1, juegue HalcΓ³n);
ο§ El Jugador 2 serΓ‘ indiferente respecto de sus estrategias puras y de cualquier combinaciΓ³n lineal de ellas, siempre que π = 3/4
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Teorema: Equilibrio de Nash (Existencia)
Sea el Juego Ξ = [π; π1, β¦ , ππ; π’1, β¦ , π’π]. Suponga que se cumplen: i. ππ es subconjunto no vacΓo y compacto de βπ
ii. π’π es continua en π = βππ=1ππ = π1 Γ π2 Γ β― Γ ππ y es estrictamente cuasicΓ³ncava en π π
Entonces, existe al menos un Equilibrio de Nash en Estrategias Puras para Ξ
DemostraciΓ³n: Ver Fundenberg and Tirole 1992.
Corolario (Nash, 1950):
En todo juego finito Ξ = [π; π1, β¦ , ππ; π’1, β¦ , π’π], existe al menos un Equilibrio de Nash en estrategias Mixtas bajo i. y ii.
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
ApΓ©ndice: Teorema Punto Fijo [ Kakutani ]:
Sea π un subconjunto compacto y convexo de ββ y sea π: π β π una correspondencia tal que: ο Para todo π₯ β π el conjunto π(π₯) es no vacΓo y convexo
ο π(π₯) es hemicontinuo superior
TeorΓa de los Juegos β Equilibrio de Nash // @JackFlash
Referencias
ο§ Bauman, Y. (2009): Quantum Micro, Class Notes. Whitman College.
ο§ Barron, E.N. (2008): Game Theory. An Introduction. Hoboken (N.J.): John Wiley. ο§ Fundenberg, D. and J. Tirole (1992): Game Theory. Cambridge: MIT press. ο§ Gibbons, R. (1992): Un Primer Curso de TeorΓa de Juegos. Barcelona: Antoni Bosch.
ο§ Jehle, G. and P.J. Reny (2001): Advanced Microeconomic Theory. N.Y.: Addison-Wesley. ο§ Lancaster, K. (2011): Mathematical Economics. N.Y.(N.Y.): Dover.
ο§ Manrique, O., E. Villa, G. Junca y S. Monsalve (1999): Competencia Imperfecta I: Equilibrio de Nash en Juegos
Estaticos. CapΓtulo IV En: Monsalve, S. [ed.] (1999): IntroducciΓ³n a los Conceptos de Equilibrio en EconomΓa.
BogotΓ‘: Universidad Nacional de Colombia.
ο§ Mas-Colell, A., M.D. Whinton and J.R.Green (1985): Microeconomic Theory. Oxford: Oxford University Press.
ο§ Monsalve, S. [ed.] (1999): IntroducciΓ³n a los Conceptos de Equilibrio en EconomΓa. BogotΓ‘: Universidad Nacional de Colombia.
ο§ Monsalve, S. y J. ArΓ©valo [eds.] (2005): Un Curso de TeorΓa de Juegos ClΓ‘sica. BogotΓ‘: Universidad Externado de Colombia.
ο§ Montet, C. and D. Serra (2003): Game Theory & Economics. N.Y. (N.Y.): Palgrave.
ο§ Nash, John (1950): Equilibrium points in n-person games. Proceedings of the National Academy of Sciences 36(1):48-49.
ο§ Nash, John (1951): Non-Cooperative Games. The Annals of Mathematics 54(2):286-295. ο§ Takayama, A. (1985): Mathematical Economics. Cambridge: Cambridge University Press. ο§ Varian, H. (1993): Microeconomic Analysis. N.Y.: Norton & Co.