curso introducción a la teoría de juegos apuntes prof ...curso introducción a la teoría de...

31
1 Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el alumno se forma una primera idea sobre los instrumentos que la teoría de juegos ofrece para analizar situaciones estratégicas y aprende a dar los primeros pasos en la elaboración y solución de modelos formales. La teoría de juegos representa una pequeña parcela dentro del ámbito más amplio de lo que se conoce como teoría de la elección racional.Por tanto, parece oportuno introducir el curso explicando el supuesto de racionalidad. La premisa de la que parte el supuesto de racionalidad es muy sencilla: los agentes tienen deseos de cómo les gustaría que fuera el mundo y creencia de cómo funciona el mundo. En la terminología propia de la teoría de juegos, a eso se le llama preferencias. Una vez que el agente/actor (individuo o colectivo) tiene claras sus preferencias, el principio de racionalidad establece que actuará en función de las mismas. Lo que implica que actúa buscando lo mejor frente a lo peor. Este supuesto se conoce también como el supuesto del comportamiento auto-interesado. El agente actúa en función de sus preferencias y no en función de las preferencias de los demás. Comportamiento auto-interesado no implica necesariamente comportamiento egoísta. El agente puede ser egoísta en el sentido de que se preocupa por su propio bienestar, pero también puede ser también altruista involucrando en su orden de preferencias el bienestar de los demás. Vamos a cerrar este punto con una definición genérica que nos puede ser operativa sobre el principio de racionalidad: un agente es racional cuando, al elegir entre las alternativas disponibles, elige en función de sus preferencias Para avanzar en nuestra definición de racionalidad es necesario introducir la idea de que todo orden de preferencias, para ser funcional a la herramienta analítica de la Teoría de Juegos, debe ser completo y transitivo. Por “completo” se entiende que deben ser consideradas todas las preferencias, mientras que por “transitivo” que cuando un determinado agente desea la preferencia A sobre la B, y la preferencia B sobre la C, entonces debe preferir A sobre C. A las preferencias de los agentes se les asigna un valor cuantitativo que miden la utilidad o el bienestar que una persona obtiene si se da una cierta consecuencia cuando realiza una cierta acción. Es lo que se conoce como “Función de Utilidad”. Las funciones de utilidad tienen grados diversos de complejidad según el contexto de la acción en que se apliquen. Esto es, puede existir certidumbre sobre la utilidad esperada o puede haber incertidumbre sobre esta utilidad. Caracterización de los Juegos Comencemos el recorrido por la Teoría de Juegos caracterizando los distintos tipos de juegos. Para ello el punto de partida es reconocer los diferentes componentes de un juego. Estos son: a) Lista de Jugadores . ¿Cuántos jugadores participan? Pueden ser 1, 2 o n jugadores Cuando tenemos un único jugador estamos ante juegos en contextos paramétricos ya que el agente conoce todos los parámetros que afectan a su decisión. Cuando son 2 o más jugadores enfrentamos situaciones estratégicas porque el resultado de las decisiones del jugador se encuentre afectada por las decisiones del resto y viceversa; b) Lista Completa de Estrategias . En el curso de las interacciones entre jugadores éstos actúan como si se ciñeran a un plan exhaustivo, en el que se contemplara cualquier contingencia, incluso la más improbable. Estos planes reciben el nombre de estrategias y

Upload: others

Post on 13-Mar-2020

16 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

1

Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa

El propósito de este curso quedará cumplido si el alumno se forma una primera idea sobre los instrumentos que la teoría de juegos ofrece para analizar situaciones estratégicas y aprende a dar los primeros pasos en la elaboración y solución de modelos formales. La teoría de juegos representa una pequeña parcela dentro del ámbito más amplio de lo que se conoce como teoría de la elección racional.Por tanto, parece oportuno introducir el curso explicando el supuesto de racionalidad. La premisa de la que parte el supuesto de racionalidad es muy sencilla: los agentes tienen deseos de cómo les gustaría que fuera el mundo y creencia de cómo funciona el mundo. En la terminología propia de la teoría de juegos, a eso se le llama preferencias. Una vez que el agente/actor (individuo o colectivo) tiene claras sus preferencias, el principio de racionalidad establece que actuará en función de las mismas. Lo que implica que actúa buscando lo mejor frente a lo peor. Este supuesto se conoce también como el supuesto del comportamiento auto-interesado. El agente actúa en función de sus preferencias y no en función de las preferencias de los demás. Comportamiento auto-interesado no implica necesariamente comportamiento egoísta. El agente puede ser egoísta en el sentido de que se preocupa por su propio bienestar, pero también puede ser también altruista involucrando en su orden de preferencias el bienestar de los demás. Vamos a cerrar este punto con una definición genérica que nos puede ser operativa sobre el principio de racionalidad: un agente es racional cuando, al elegir entre las alternativas disponibles, elige en función de sus preferencias Para avanzar en nuestra definición de racionalidad es necesario introducir la idea de que todo orden de preferencias, para ser funcional a la herramienta analítica de la Teoría de Juegos, debe ser completo y transitivo. Por “completo” se entiende que deben ser consideradas todas las preferencias, mientras que por “transitivo” que cuando un determinado agente desea la preferencia A sobre la B, y la preferencia B sobre la C, entonces debe preferir A sobre C. A las preferencias de los agentes se les asigna un valor cuantitativo que miden la utilidad o el bienestar que una persona obtiene si se da una cierta consecuencia cuando realiza una cierta acción. Es lo que se conoce como “Función de Utilidad”. Las funciones de utilidad tienen grados diversos de complejidad según el contexto de la acción en que se apliquen. Esto es, puede existir certidumbre sobre la utilidad esperada o puede haber incertidumbre sobre esta utilidad. Caracterización de los Juegos Comencemos el recorrido por la Teoría de Juegos caracterizando los distintos tipos de juegos. Para ello el punto de partida es reconocer los diferentes componentes de un juego. Estos son:

a) Lista de Jugadores. ¿Cuántos jugadores participan? Pueden ser 1, 2 o n jugadores Cuando tenemos un único jugador estamos ante juegos en contextos paramétricos ya que el agente conoce todos los parámetros que afectan a su decisión. Cuando son 2 o más jugadores enfrentamos situaciones estratégicas porque el resultado de las decisiones del jugador se encuentre afectada por las decisiones del resto y viceversa;

b) Lista Completa de Estrategias . En el curso de las interacciones entre jugadores éstos

actúan como si se ciñeran a un plan exhaustivo, en el que se contemplara cualquier contingencia, incluso la más improbable. Estos planes reciben el nombre de estrategias y

Page 2: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

2

deben identificarse todas ellas en la formulación de un juego. Las estrategias pueden ser “puras” o “mixtas”. Posteriormente atenderemos este tema.

c) Pagos: o utilidades que recibe cada jugador tras seleccionar sus estrategias.

d) Información: Un aspecto muy relevante en la modelización de juegos es la información

con que cuentan los jugadores para tomar sus decisiones estratégicas. Los juegos pueden ser de Información Completa o Incompleta. Profundicemos en esta tema.

a. Decisiones (y no juegos) de una persona con información perfecta

• Información perfecta: significa que el jugador conoce exactamente todo lo que ha ocurrido antes que le toque jugar. Por ejemplo, el ajedrez es un juego de información perfecta, el poker es un juego de información imperfecta.

Ejercicio 1 (similar al caso del oro): Usted se encuentra en Londres y desea visitar el palacio de Buckingham. Su hotel se encuentra cercano a la estación New Cross Gate de la línea East London del metro y sabe que su destino final para llegar al palacio es la estación Victoria. (Mapa del metro de Londres en página siguiente.) Está apurado(a) porque sabe que si llega demasiado tarde no podrá entrar a visitar el palacio, pero sabe que la mejor manera para ahorrar tiempo es una buena planificación de su viaje. Asuma que el viaje entre cada estación toma 5 minutos y cada combinación requiere de 5 minutos adicionales.

i. Encuentre, al menos tres posibles rutas para llegar desde New Cross Gate hasta Victoria. Escriba estas rutas de decisión de manera extensiva y refleje cuántos minutos le toma cada una de las opciones que figuró. Finalmente señale cuál es la alternativa más rápida para el viaje. Ayuda: Note que cada estación de combinación que esté en la ruta que usted diseñe es un nodo de decisión, siendo la alternativa combinar o seguir. Posiblemente alguna de las dos alternativas sólo consiga alejarlo(a) de su objetivo, en tal caso señale como 0 el pago de seguir tal opción.

ii. Escriba los pagos de forma normal. b. Juegos de dos personas con información perfecta

• Juego de decisiones simultáneas: los dos jugadores deben seleccionar sus estrategias al mismo tiempo.

• Juego de decisiones secuenciales: los jugadores tienen turnos preestablecidos para realizar sus elecciones. Lo importante para que la situación sea secuencial es que una vez que haya elegido no se puede arrepentir de su decisión.

Ejercicio 2 (Dios le da pan al que no tiene dientes...) Fernanda y Patricio están disfrutando de su primer año de casados y están acostumbrados a divertirse juntos durante los fines de semana. Sin embargo, el fin de semana siguiente se presenta un conflicto. Resulta que Fernanda es fanática de Colo-Colo y quiere ir al monumental a ver el partido contra la U. Patricio es un cinéfilo empedernido y no quiere perderse el avant première de la última película de romántica de Meg Ryan que tiene lugar a la misma hora del partido en los cines del Parque Arauco. Naturalmente que para ninguno de los dos tiene valor disfrutar del espectáculo si no está el otro, pero también llevan el suficiente tiempo juntos como para no tener que hacer cosas por compromiso. En pocas palabras, Fernanda prefiere ir al fútbol con Patricio respecto a ir al cine con Patricio, pero prefiere ir al cine con Patricio antes que ir al cine o al fútbol sola. Por su parte, Patricio tiene preferencias similares: lo

Page 3: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

3

que más le gustaría es ir al cine con Fernanda, luego ir al fútbol con Fernanda y en el último escalón se encuentra la posibilidad de hacer cualquier cosa solo.

Page 4: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

4

Page 5: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

5

i. Identifique cuáles son las estrategias posibles que puede seguir cada uno de los dos jugadores.

ii. Fernanda y Patricio han estado charlando pero no consiguen ponerse de acuerdo. Patricio hace una escena furioso, y antes de cerrar la puerta de un golpe dice enojado: “Decide lo que quieras, yo también voy a decidir lo que quiera, si nos encontramos bien y si no también”. ¿Cómo formalizaría usted una situación de este tipo: eligen de manera simultánea o secuencial?

iii. Escriba el juego en forma normal. Formalice de alguna forma que usted considere razonable los pagos que reciben los jugadores en cada alternativa.

iv. Escriba el juego ahora en forma extensiva. v. Asuma que, en lugar de decir lo señalado en el punto ii, Patricio dice: “Yo me voy al cine, si

te interesa nos vemos ahí, eres libre para hacer lo que quieras”. ¿Es el juego ahora simultáneo o secuencial? ¿Es de información perfecta o imperfecta?

vi. Escriba el juego de manera extensiva. vii. Escriba el juego de manera normal. c. Juegos como el ajedrez Ejercicio 3 (Jugando con los números) Considere el juego de suma cero visto en clases. Encuentre pagos u, v y x (es decir otorgue valores numéricos a u, v y x) tales que: i) el jugador 1 se asegura ganar; ii) el jugador 2 se asegura ganar, iii) se asegura un empate. d. Estrategias dominantes y dominadas Ejercicio 4 (las dos caras de la moneda) Juan es un tipo decididamente calculador y está evaluando si le conviene dedicarse a robar o a trabajar durante el presente mes. Naturalmente su decisión depende de qué tan duros contra el crimen estén los carabineros. Él sabe que, con su habilidad, si se dedica a robar y carabineros no tiene una política dura (política blanda), entonces él se queda con 1 millón de pesos al mes. Ahora, si carabineros tiene una política dura con los delincuentes, él sabe que lo van a capturar con seguridad. Su cuenta en este caso es más complicada, ya que por el crimen que comete gana 1 millón de pesos (que logra esconder antes que lo encuentren) pero tiene que pagar con 1 mes de cárcel y tiene que lidiar con el enojo de su esposa. Él sabe que, de no pagarle 500 mil pesos a su abogado, se debería quedar 30 años, así que calcula que debe destinar esa parte de su motín a su asesor jurídico. Por otro lado, se debe gastar, al menos (diría ella), $350 mil en regalos a su esposa para que lo deje volver a la casa. Su alternativa a robar es trabajar y, si opta por este camino, independientemente de la actitud de la policía, él recibe $100 mil al mes.

i. Represente este juego en forma normal. ii. Encuentre la estrategia dominante que tiene Juan.

iii. Ahora asuma que Juan tiene una segunda alternativa de trabajo (es decir, debe optar entre robar, el trabajo ya descrito y el siguiente trabajo). El segundo trabajo consiste en ser carabinero. Si la cúpula de carabineros decide que la política a aplicar contra los delincuentes es blanda, entonces a cada carabinero le pagan $100 mil al mes; pero si la política es dura, entonces el pago asciende a $1,05 millones mensuales. Identifique la estrategia dominada en este caso. Explique si es estricta o débilmente dominada. Muestre que Juan no tiene estrategias dominantes.

Page 6: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

6

Teoría de Juegos Sesión 3

Prof. Emanuel Vespa

• Aspectos teóricos

El tema central de esta sesión es el concepto de Equilibrio de Nash en juegos simultáneos. De una forma muy concreta, podemos definir un Equilibrio Nash como la forma de determinar cuales son las opciones estratégicas de los jugadores ya que el resultado de la combinación de éstas lleva a que ninguno de ellos tenga incentivos para cambiar su estrategia.

Hay tres maneras de determinar un equilibrio de Nash en estos juegos. Primera: Análisis estratégico de las alternativas Esta manera de resolución debe aplicarse en pasos iterados:

1. Tomar al jugador 1 y asumir que el jugador 2 juega su primer estrategia. Entonces, dado que el jugador 2 juega su primer estrategia fijarse qué estrategia le conviene al jugador 1 entre todas las que tiene para elegir. Marcar esa elección.

2. Tomar al jugador 1 y repetir el paso 1 para cada una de las demás estrategias del jugador 2. 3. Tomar al jugador 2 y repetir los pasos anteriores, asumiendo en cada caso estrategias dadas

para el jugador 1. El equilibrio de Nash consistirá en aquél par de estrategias que son simultáneamente seleccionadas por ambos jugadores. Ejemplo: Tomar el juego descrito en forma normal como sigue:

Jugador 2 I D

I (1, 5) (9, 0) Jugador 1 D (4, 3) (2, 2)

Una aplicación del paso 1 es tomar al jugador 1 y asumir que el jugador 2 juega izquierda (I). En tal caso al jugador 1 le conviene jugar derecha (D) porque ésta otorga un pago más alto que I (4 > 1). Entonces procedemos a marcar esta elección con una raya por debajo de la decisión que corresponde a la elección que toma el jugador 1 si el jugador 2 elige izquierda:

Jugador 2 I D

I (1, 5) (9, 0) Jugador 1 D (4_, 3) (2, 2)

El paso 2 consiste en aplicar la misma lógica pero para las restantes estrategias del jugador 2. En este caso queda sólo una estrategia más que es que el jugador 2 juegue I. Si el jugador 2 juega D, entonces al jugador 1 le conviene jugar I porque el pago de esta estrategia (9) es mayor que el pago de la alternativa (2). Así tenemos,

Page 7: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

7

Jugador 2 I D

I (1, 5) (9_, 0) Jugador 1 D (4_, 3) (2, 2)

El paso 3 consiste en repetir los pasos 1 y 2 pero para el jugador 2. Así tenemos que si el jugador 2 asume que el jugador 1 va a jugar I, debe comparar un pago de 5 con un pago de 0. Claramente como 5 > 0, al jugador 2 le conviene elegir I si el jugador 1 juega I. Ahora, si el jugador 1 juega D, entonces al jugador 2 también le conviene jugar I, porque el pago 3 > 2. Finalmente la matriz queda:

Jugador 2 I D

I (1, 5_) (9_, 0) Jugador 1 D (4_, 3_) (2, 2)

El equilibrio de Nash va a ser este par de estrategias que es seleccionada por ambos jugadores. En este caso las marcas las tiene el caso en que el jugador 2 juega I y el jugador 1 juega D. El equilibrio de Nash se escribe: EN = {(D, I)}, donde la primera componente señala la estrategia del jugador 1 y la segunda la del jugador 2. Segunda: Proponer posibles estrategias de equilibrio y verificar desvíos Esta segunda alternativa consiste en las siguientes etapas:

1. Se propone un equilibrio. 2. Se verifica si, dadas las estrategias de equilibrio alguno de los jugadores se quiere desviar. 3. Si alguno se quiere desviar, entonces el equilibrio propuesto no es equilibrio. 4. Si ninguno se quiere desviar, entonces el equilibrio es un equilibrio de Nash. 5. Si alguno se quiere desviar, entonces proponer otro equilibrio y repetir el proceso.

Esta alternativa hace el uso de la siguiente definición de Equilibrio de Nash: En el caso de un juego de dos jugadores, el par (E1, E2), donde E1 es la estrategia del jugador 1 y E2 es la estrategia del jugador 2 es un equilibrio de Nash (EN) si dada E2, el jugador 1 prefiere jugar E1 y dada E1 el jugador 2 prefiere jugar E2. Veamos cómo se aplica en el caso del ejemplo.

Jugador 2 I D

I (1, 5) (9, 0) Jugador 1 D (4, 3) (2, 2)

El primer paso consiste en proponer un equilibrio posible. El caso en que ambos ganan más es cuando el jugador 1 juega I y el dos juega D. Así el pago agregado llega a 9 que es el máximo que pueden juntar en conjunto. Propongamos esta opción como equilibrio. Ahora debemos preguntarnos, dado que en este equilibrio propuesto el jugador 2 juega D, ¿tiene el jugador 1 incentivo a desviarse y no jugar I sino jugar D? La respuesta es no, el jugador 1 gana 2

Page 8: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

8

jugando D y gana 9 jugando I por lo tanto no hay incentivos al desvío. Luego para el otro jugador. Dado que el jugador 1 juega I en este equilibrio propuesto, ¿tiene incentivos el jugador 2 a desviarse y no jugar D? La respuesta es que sí tiene incentivos puesto que el pago de jugar I (5) es mayor a jugar D (0) cuando el jugador 1 juega I. Por lo tanto, como un jugador tiene incentivos a desviarse esto no puede ser un equilibrio de Nash. El paso 2 y 3 en conjunto nos dicen que esta iteración ha llegado a su fin. Según el paso 5 si la iteración anterior llegó a su fin, entonces hay que proponer un nuevo equilibrio. Propongamos {(D, I)} como equilibrio. En este caso el jugador 2 juega I. ¿Tiene incentivos el jugador 1 a no jugar D? No, si juega I gana 1 pero jugando D gana 4, entonces no se quiere mover. Desde el punto de vista del jugador 2 ahora, para él el jugador 1 juega D, ¿tiene incentivos el jugador 2 a no jugar I? Claramente tampoco porque prefiere ganar 4 jugando I a ganar 2 jugando D. Entonces este equilibrio propuesto es un equilibrio de Nash.

Jugador 2 I D

I (1, 5) (9, 0) Jugador 1 D (4, 3) (2, 2)

Hay que tener cuidado con esta manera de resolver porque nos puede inducir a respuestas incompletas. Asumamos por ejemplo que un juego tiene dos equilibrios de Nash. Entonces cuando hagamos todo este procedimiento y encontremos el primero de ellos podemos pensar erróneamente que es el único. Como este proceso es caso a caso, lo que corresponde es repetirlo para todos las alternativas posibles. Para el ejemplo en cuestión habría que repetirlo en total cuatro veces. Tercera: Armar las funciones de mejor respuesta Las funciones de mejor respuesta se arman en los siguientes pasos:

1. Tomar al jugador 1 y fijarse qué estrategia le conviene ante cada estrategia del jugador 2 2. Tomar al jugador 2 y fijarse qué estrategia le conviene jugar ante cada estrategia del jugador

1. 3. Empezar por cualquier lado. Por ejemplo, proponer que el jugador 1 juega su primer

estrategia (E1). Fijarse cuál es la mejor respuesta del jugador 2 si el jugador 1 juega esa estrategia.

4. Luego ir a la función de mejor respuesta del jugador 1 y fijarse qué le conviene hacer al jugador 1 si el jugador 2 le ha jugado la estrategia del punto 3. Si el jugador 1 responde con E1, entonces el par de estrategias es un equilibrio, caso contrario no es un equilibrio.

5. Si no es un equilibrio, entonces repetir pasos 3 y 4 pero ahora comenzando con que el jugador 1 juega su segunda estrategia (E2). Repetir iterativamente.

La aplicación de estos pasos al ejemplo es simple. Paso 1: Si el jugador 1 juega I, entonces podemos apreciar que al jugador 2 le conviene jugar I a jugar D. Además si el jugador 1 juega D, entonces al jugador 2 también le conviene jugar I a jugar D. Así podemos escribir el siguiente cuadro:

Page 9: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

9

Función de mejor respuesta del jugador 2:

Al jugador 2 le conviene jugar (mejor respuesta)

I I Si el jugador 1 juega D I

Paso 2: El segundo paso involucra realizar lo mismo pero para el otro jugador. En este caso sabemos que para el jugador 1 se puede resolver de manera análoga así tenemos: Función de mejor respuesta del jugador 1:

Al jugador 1 le conviene jugar (mejor respuesta)

I D Si el jugador 2 juega D I

Paso 3: Ahora comencemos a iterar. Asumamos que el jugador 1 decide jugar I. Si el jugador 1 juega I sabemos por la función de mejor respuesta del jugador 2 que al jugador 2 le conviene jugar I. Paso 4: Ahora, si el jugador 2 juega I, entonces, siguiendo la función de mejor respuesta del jugador 1, tenemos que al jugador 1 le conviene jugar D. Esto es una contradicción, porque inicialmente supusimos que el jugador 1 jugaba I y terminamos el círculo diciendo que responde con D. Luego que el jugador 1 comience jugando I no es un equilibrio. Paso 5: Ahora asumamos que el jugador 1 juega D. En tal caso al jugador 2 le conviene responder con I, según su función de mejor respuesta. Pero si el jugador 2 responde con I según la función de mejor respuesta del jugador 1 al jugador 1 le conviene responder con D. Esto sí es un equilibrio porque finalmente el jugador 1 termina jugando lo que asumimos inicialmente que hacía. Digamos que el argumento es circular. Entonces que el jugador 1 elija D y el jugador 2 juegue I es un equilibrio de Nash.

• Aplicaciones Ahora a practicar. Ejercicio 1 El enunciado del ejercicio 2 de la Sesión 2 decía: “(Dios le da pan al que no tiene dientes...) Fernanda y Patricio están disfrutando de su primer año de casados y están acostumbrados a divertirse juntos durante los fines de semana. Sin embargo, el fin de semana siguiente se presenta un conflicto. Resulta que Fernanda es fanática de Colo-Colo y quiere ir al monumental a ver el partido contra la U. Patricio es un cinéfilo empedernido y no quiere perderse el avant première de la última película de romántica de Meg Ryan que tiene lugar a la misma hora del partido en los cines del Parque Arauco. Naturalmente que para ninguno de los dos tiene valor disfrutar del espectáculo si no está el otro, pero también llevan el suficiente tiempo juntos como para no tener que hacer cosas por compromiso. En pocas palabras, Fernanda prefiere ir al fútbol con Patricio respecto a ir al cine con Patricio, pero prefiere ir al cine con Patricio antes que ir al cine o al fútbol sola. Por su parte, Patricio tiene preferencias similares: lo que más le gustaría es ir al cine con Fernanda, luego ir al fútbol con Fernanda y en el último escalón se encuentra la posibilidad de hacer cualquier cosa solo.”

Page 10: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

10

a. Escriba el juego en forma normal. b. Evalúe si los jugadores tienen estrategias dominantes. c. Encuentre el (los) equilibrios de Nash por análisis estratégico de las alternativas. d. Encuentre el (los) equilibrios de Nash proponiendo de estrategias de equilibrio y verificando

desvíos. e. Encuentre el (los) equilibrios de Nash a partir de las funciones de mejor respuesta.

Ejercicio 2 El ejercicio 4 de la Sesión 2 indicaba: (las dos caras de la moneda) Juan es un tipo decididamente calculador y está evaluando si le conviene dedicarse a robar o a trabajar durante el presente mes. Naturalmente su decisión depende de qué tan duros contra el crimen estén los carabineros. Él sabe que, con su habilidad, si se dedica a robar y carabineros no tiene una política dura (política blanda), entonces él se queda con 1 millón de pesos al mes. Ahora, si carabineros tiene una política dura con los delincuentes, él sabe que lo van a capturar con seguridad. Su cuenta en este caso es más complicada, ya que por el crimen que comete gana 1 millón de pesos (que logra esconder antes que lo encuentren) pero tiene que pagar con 1 mes de cárcel y tiene que lidiar con el enojo de su esposa. Él sabe que, de no pagarle 500 mil pesos a su abogado, se debería quedar 30 años, así que calcula que debe destinar esa parte de su motín a su asesor jurídico. Por otro lado, se debe gastar, al menos (diría ella), $350 mil en regalos a su esposa para que lo deje volver a la casa. Su alternativa a robar es trabajar y, si opta por este camino, independientemente de la actitud de la policía, él recibe $100 mil al mes.

a. Escriba el juego en forma normal. Obviamente no conoce los pagos del jugador “carabineros”, pero indíquelos con letras que podrán tomar luego distintos números.

b. Elija pagos para el jugador “carabineros” tales que el juego tenga un único equilibrio de Nash.

c. Elija pagos para el jugador “carabineros” tales que el juego tenga 2 equilibrios de Nash. d. Elija pagos para el jugador “carabineros” tales que el juego no tenga equilibrios de Nash.

Page 11: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

11

Teoría de juegos Prof.: Emanuel Vespa

Cuarta sesión: equilibrio de Nash en estrategias mixtas

• Aspectos teóricos

La resolución del Equilibrio de Nash en estrategias mixtas se mostrará a partir del desarrollo del siguiente ejemplo. Este juego se llama “Nicho de mercado” y lo vimos brevemente en clases. Consta de dos jugadores, dos empresas precisamente. Cada una de ellas debe decidir si comienza a desarrollar un nuevo nicho de mercado o no. Es decir, sus estrategias posibles son entrar al mercado o quedarse fuera como lo muestra la expresión del juego en forma normal:

Empresa 2 Entrar Afuera

Entrar (-50, -50) (100, 0) Empresa 1 Afuera (0, 100) (0, 0)

Los pagos indican que si ambas entran entonces las dos tienen una pérdida de 50, si una entra y la otra se queda fuera, entonces la que entra gana 100 y la que se queda afuera no recibe nada y finalmente si ambas se quedan afuera ninguna recibe nada. Es fácil chequear (¡háganlo!) que este juego tiene dos equilibrios de Nash en estrategias puras: NE{(Afuera, Entrar); (Entrar Afuera)}. Ahora, supongamos que una de las empresas nos contrata para aconsejarla y dada nuestra elaborada resolución le decimos: “Si el otro entra, a usted le conviene no entrar, si usted entra y el otro no, entonces a usted le va a ir muy bien”; ante esta respuesta posiblemente la empresa que nos contrató se va a estar preguntando qué es lo que está pagando tan caro. Este juego tiene un equilibrio de Nash en estrategias mixtas. El caso es que en este caso es importante la imprevisibilidad. Para encontrar el equilibrio de Nash en estrategias mixtas vamos a proceder en distintos pasos sucesivos: Paso 1: Redefinir el campo de estrategias. En el caso de estrategias “puras” cada empresa tiene que elegir una de dos alternativas: o bien entra o bien se queda afuera. Las estrategias mixtas nos otorgan más flexibilidad: el individuo debe elegir ahora no una estrategia puntual, sino la probabilidad con la que va a jugar las distintas estrategias. Por ejemplo, una estrategia mixta consiste en este caso en jugar entrar con probabilidad 25% y no entrar con probabilidad 75%. Fíjense que como tenemos sólo dos estrategias puras, entonces si definimos la probabilidad con la que jugamos una de esas estrategias automáticamente estamos definiendo la probabilidad de jugar la otra. Es decir, si vamos a jugar “entrar” con probabilidad 25%, entonces el 75% restante de las veces debemos estar jugando “afuera”. Por lo tanto, sólo estamos eligiendo la probabilidad de jugar una de las estrategias y la otra se determina complementariamente. Llamemos “p1” a la probabilidad de entrar de la empresa 1, entonces (1- p1) es la probabilidad de quedarse afuera. En síntesis, en el caso de estrategias mixtas lo que hay que hacer es determinar un valor para las probabilidades de jugar las estrategias. Paso 2: Definir qué controla cada jugador y cómo lo hace Hay que tener muy presente que cada jugador puede elegir su probabilidad. En este caso la empresa 1 puede controlar la elección de p1 y la empresa 2 decide sobre el valor que toma p2. Como el

Page 12: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

12

problema es de interacción estratégica lo que estará buscando cada jugador al decidir sobre su probabilidad es cómo responde el otro ante esa elección específica. Por ejemplo, asumamos que el jugador 2 se dispone con la siguiente estrategia mixta: p2 = 30%, su pregunta será ¿qué implica esto sobre las decisiones del jugador 1? Lo que tenemos que hacer es calcular el valor esperado del jugador 1 para cada una de sus estrategias dada la estrategia mixta del jugador 2. Comencemos por la estrategia de entrar:

VE1(Entrar) = -50 * 30% + 100 * 70% = 55 La línea anterior calcula el valor esperado para el jugador 1 de seguir la estrategia de entrar dado que el jugador 2 entra con probabilidad 30%. Fíjense que el primer término es la pérdida del jugador 1 si decide entrar cuando el jugador 2 entra (-50) por la probabilidad que el jugador 2 entre (30%), mientras que el segundo término es el pago del jugador 1 si decide entrar cuando el jugador 2 no entra (100) por la probabilidad que el jugador 2 no entre (100% - 30% = 70%). Así el pago esperado de esta estrategia es 55. Calculemos ahora el pago esperado de no entrar:

VE1(Afuera) = 0 * 30% + 0 * 70% = 0

Ahora, dada la estrategia del jugador 2 “p2 = 30%”, al jugador 1 le conviene entrar porque VE1(Afuera) < VE1(Entrar). Es decir, el jugador 2 aprende que si usa la estrategia “p2 = 30%” entonces sí o sí el jugador 1 va a entrar. Pero esto aparentemente no es muy bueno para el jugador 2 porque no ha conseguido imprevisibilidad: dado lo que hace es totalmente fácil decidir para el jugador 1 qué hacer. Fíjense que esto va a ocurrir siempre que VE1(Afuera) sea distinto a VE1(Entrar). Por lo tanto, para ser verdaderamente impredecible el jugador 2 tiene que buscar aquella probabilidad que haga que el jugador 1 esté indiferente entre quedarse afuera o entrar. Paso 3: Encontrar el equilibrio de Nash Resolvamos el caso del jugador 2 cuando quiere dejar indiferente al jugador 1 entre entrar o no entrar, esto implica resolver la siguiente ecuación:

VE1(Entrar) = -50 * p2 + 100 * (1- p2) = 0 * p2 + 0 * (1- p2) = VE1(Afuera)

VE1(Entrar) = -50 * p2 + 100 * (1- p2) = 0 = VE1(Afuera)

-150 * p2 + 100 = 0

100/150 = p2

p2 = 2/3

Por lo tanto, si el jugador 2 juega la estrategia de entrar con probabilidad 2/3, entonces no está siendo previsible para el jugador 1 que, ante esta estrategia queda indiferente entre entrar y quedarse afuera. Para encontrar el equilibrio de Nash en estrategias mixtas también nos tenemos que poner desde el punto de vista del otro jugador. Es decir el jugador 1 debe escoger la probabilidad de entrar p1 observando cómo responde el otro jugador ante esta alternativa. Como el juego es simétrico (¡verifíquenlo ustedes!) el resultado debe ser que p1 = 2/3. Así el equilibrio de Nash en estrategias mixtas queda: NE = {( p1 = 2/3, p2 = 2/3)}.

Page 13: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

13

• Ejercicios de aplicación Ejercicio 1: Tome el ejercicio 2 de la sesión 1 (Dios le da pan al que no tiene dientes...) y encuentre un equilibrio de Nash en estrategias mixtas. Ejercicio 2: De sus notas de clase busque el problema de misiles y antimisiles analizado entre Irak y Estados Unidos. Recuerde que ese problema no tenía equilibrio de Nash en estrategias puras. Encuentre el equilibrio de Nash en estrategias mixtas. Ejercicio 3: Encuentre los equilibrios de Nash en estrategias puras y mixtas para el juego del Nicho con la única siguiente modificación: si la empresa 1 entra y la empresa 2 se queda afuera, entonces la empresa 1 gana 150. Ejercicio 4: (modificación a pares/impares) En el siguiente juego de dos jugadores cada uno de ellos debe optar por mostrar 3 o 4 dedos. Ambos deben realizar esta acción simultáneamente. El que gana recibe $1 y el que pierde debe pagar $1. Represente este juego en forma normal si el jugador 1 es neutral al riesgo y el jugador 2 es amante del riesgo. Busque los equilibrios de Nash en estrategias puras y mixtas. Ejercicio 5: (más difícil) Este es un juego de dos jugadores con 3 estrategias puras posibles. El arquero puede decidirse por tirarse a la derecha, al centro o a la izquierda y el que patea el penal puede optar por tirarlo a la derecha, al centro o a la izquierda. Si la pelota se dirige al mismo lugar que el arquero, entonces el arquero ataja 1 penal y el que patea se perdió 1 penal. Si la pelota se dirige a un lugar distinto que el arquero, entonces el penal termina en gol. Busque los equilibrios de Nash en estrategias puras y mixtas.

Page 14: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

14

Teoría de juegos

Quinta sesión: Equilibrio de Nash perfecto en subjuegos

• Aspectos teóricos Un subjuego es cualquier parte del juego que puede jugarse en sí mismo como un juego. Formalmente se dice que es un conjunto de nodos y ramas que satisfacen:

i. Comienzan en un único nodo ii. Contiene a todo nodo sucesor iii. Si tiene algún nodo en set de información, entonces contiene a todos los nodos en ese set

de información. Un equilibrio de Nash es perfecto en subjuegos si cada jugador juega un equilibrio de Nash en todo subjuego. Para encontrar un Equilibrio de Nash perfecto en subjuego en juegos finitos con información perfecta hay que ocupar el principio de inducción hacia atrás. El mismo consiste en los siguientes pasos:

i. Comenzar al final del juego e identificar el equilibrio de Nash para cada uno de los subjuegos finales (los que no tienen subjuegos incluidos en ellos).

ii. Elegir un equilibrio de Nash de cada uno de estos subjuegos y derivar el juego reducido en forma extensiva en el que el subjuego final se reemplaza por los pagos de la estrategia que es equilibrio de Nash en el subjuego.

iii. Repetir los pasos i y ii para el juego reducido. La colección de estos movimientos consiste al equilibrio perfecto en subjuegos del juego como un todo.

Un ejemplo:

1 L R 2 2 a b a b 1 1 (2, 0) (1,3) Q R Q R (5,-2) (3,8) (2,2) (1,18)

Page 15: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

15

El juego presentado anteriormente tiene varios subjuegos fijales. Comencemos por la rama de la izquierda. En este caso, cuando le toca jugar al jugador 2 obviamente le conviene jugar b porque gana más que jugando a. En consecuencia, el jugador 1 lo ve de la siguiente manera al juego: sabe que si elige L en la primera movida, entonces su pago va a estar dado por (1, 3), es decir, recibe 1. Vemos qué pasa con la rama de la derecha. Si nos vamos al subjuego final (parte izquierda), vemos que en este caso al jugador 1 le conviene elegir Q, ya que 5 es mayor al pago de R que es 3. En el caso del lado de la derecha tenemos que 2 es mayor que 1 por lo que si le toca elegir en ese árbol de decisión, entonces va a optar por la estrategia Q. Cuando le toca jugar al jugador 2, él lo ve de la siguiente manera: Por lo tanto al jugador 2 le conviene tomar la opción por b, ya que sabe que en este caso recibe 2, que es mayor que –2 que es lo que le otorgará seguir con la estrategia a. Finalmente el jugador 1 que tiene que decidir primero se enfrenta a las siguientes dos alternativas: Así, finalmente le resulta óptimo tomar la decisión por R. Finalmente el RESULTADO del juego es que cada uno recibirá 2 como pago, pero el equilibrio de Nash perfecto en subjuegos está dado por:

1 L R

(1,3) 2

a b (5,-2) (2,2)

1 L R

(1,3) (2,2)

1 L R

(1,3) 2

a b 1 1 Q R Q R

(5,-2) (3,8) (2,2) (1,18)

Page 16: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

16

NEPS = {(R, Q, Q) ; (b)} La notación del equilibrio es la siguiente: el primer paréntesis describe las estrategias del primer jugador en cada uno los nodos en los que le toca decidir. Los nodos se ordenan de arriba hacia abajo y si están en el mismo nivel de izquierda a derecha. El segundo paréntesis muestra las elecciones del jugador 2. Noten que hay que escribir que el jugador 1 elegiría Q en el nodo de abajo a la izquierda aun cuando nunca en el juego ese nodo se va a alcanzar. Fíjense que {(R, R, Q) ; (b)} también da el mismo resultado (pago 2, 2 para los jugadores) pero no es NEPS: el jugador 2 tiene incentivos a desviarse, ya que si el jugador 1 juega R en el nodo de abajo a la izquierda, entonces al jugador 2 no le conviene jugar b, sino jugar a. En un equilibrio de Nash perfecto en subjuegos hay que mostrar los equilibrios aun en los nodos que no se alcanzan con probabilidad positiva.

• Ejercicios

a. Primero:

i. Noten que si 2 le promete a 1 que va a elegir b si le toca elegir en la rama de la izquierda, entonces 1 obtiene su máxima ganancia posible. ¿le debería creer 1 a 2?

ii. Encuentre el ENPS.

b. Segundo: i. ¿En el siguiente juego cambia algo si en lugar de tener 2 tenemos 3 jugadores? ii. Encuentre el ENSP

1 L R 2 2 a b a b 1 1 (-3, 18) (15,3) Q R Q R (9,-3) (2,-8) (1,-1) (4,-2)

1 L R 3 2 a b a b 1 3 (2, 0, -1) (1,3,9) Q R Q R (5,-2, 2) (3,8, 1) (2,2,3) (1,18,3)

Page 17: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

17

Teoría de juegos

Sexta sesión

Prof. Emanuel Vespa

Juegos repetidos con información perfecta y cooperación

• Teoría

A. Juegos repetidos finitas veces Vamos a tomar al juego estático más simple en el que no se consigue cooperación: el dilema del prisionero. En esta historia a Tchaikovsky y al director de orquesta le ofrecen las siguientes alternativas: pueden confesar (C) o no confesar (NC). Si ninguno confiesa el crimen, entonces se quedan 3 meses cada uno. Si alguno confiesa y el otro no, entonces le dan un premio al que confesó y se va libre, mientras que el que no confesó se queda 4 meses en la cárcel. Por último si los dos confiesan se queda en prisión 2 meses cada uno. Como hemos visto anteriormente (y pueden verificar) el juego que se representa en forma normal en la siguiente matriz tiene un solo equilibrio de Nash: que ambos confiesen. Aunque es fácil ver que si se pudieran poner de acuerdo para no confesar ninguno de los dos los dos estarían mejor, sabemos que esa situación no se puede dar porque ambos tienen incentivos a confesar si es que el otro no confiesa. Así, la cooperación no es sostenible en este juego de un período. ¿Será posible cooperar si es que este juego se repite período a período?

Director orquesta (2) C NC

C (3, 3) (0, 4) Tchaikovsky (1) NC (4, 0) (2, 2)

Asumamos que el director de orquesta tiene decidido para enero de cada año dirigirse a una ciudad rusa distinta a realizar el concierto con la obra de Tchaikovsky. En esta ficción cada año se sube al tren y emprende el viaje a una ciudad distinta y cada vez que hace el viaje lo observa algún agente de la KGB que lo lleva detenido para interrogarlo por verlo con “manuscritos con códigos secretos” (las partituras de las obras de Tchaikovsky). El jefe de la KGB local busca al primer individuo con apellido Tchaikovsky del pueblo en que se encuentran y cada año le propone al director de orquesta y a Tchaikovsky un juego como el que describe la matriz anterior. Es decir, esta fábula busca que el juego que se representa en forma normal en el esquema anterior se repita por un número finito de períodos, que denominamos T. Es decir, si T = 3, esto significa que el juego se repite 3 períodos, tal que en cada período los jugadores se juntan y deciden si confiesan o no confiesan. Vamos a asumir (aunque sea extremadamente difícil de creer) que tanto Tchaikovsky como el director de orquesta saben que van a tener que jugar este juego durante T períodos. ¿Pueden cooperar, de manera de quedarse sólo 2 meses en la cárcel cada año? Previo a escribir el juego repetido conviene escribir al juego en forma expansiva, tal como se presenta a continuación (recordar que la línea punteada indica que el jugador 2 no conoce en cuál de los dos nodos se encuentra cuando le toca elegir, es decir, que tiene una decisión simultánea a la del jugador 1).

Page 18: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

18

Queremos escribir un juego que se repite T = 3 períodos y que tiene en cada período una estructura como la que se define en el esquema anterior. Para escribir al juego de manera simple podemos tomar la siguiente notación. Por un lado, el juego tiene 4 posibles resultados: (C, C), (C, NC), (NC, C), (NC, NC), entonces cada año potencialmente podría darse cualquiera de estos 4 resultados. Por otro lado, denominemos con la letra J al juego extensivo representado en el esquema anterior. Entonces 4 flechas que partan de la letra J indican, como es sabido, que el juego tiene 4 posibles resultados. El siguiente esquema muestra todas las posibilidades del juego repetido 3 períodos. Hay que leerlo de la siguiente manera: luego de la primera repetición hay 4 posibles resultados y en el segundo período hay que volver a jugar el juego, entonces para cada uno de esos posibles resultados hay nuevamente 4 posibles resultados y para el tercer período nuevamente hay 4 posibles resultados para cada uno de los resultados posibles del segundo período. Así, para apreciar todas las alternativas vemos que el árbol se expande notablemente. De todas maneras podemos ver que el hecho que el juego sea repetido permite analizar su resultado de una manera mucho más sencilla, aplicando principios de inducción hacia atrás.

(3, 3) C 2 C NC (0, 4) 1 NC C (4, 0) 2 NC (2, 2)

Page 19: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

19

.

J J J J J J J J J J J J J J J J J J J J J 1ª Rep.

2ª Rep. 3ª Rep.

Page 20: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

20

Apliquemos entonces argumentos de inducción hacia atrás y por lo tanto fijémonos en el último período del juego, el período T. En ese período, independientemente de qué rama se siga, se va a jugar un juego como el descrito por la matriz de pagos. Asumamos que se ponen de acuerdo para cooperar, ¿alguien quisiera desviarse? Claramente sí, por las mismas razones que se desvían en el juego estático de 1 período. Por lo tanto no queda otra alternativa que confesar en el último período. Es decir, independientemente de qué rama se siga, el pago del juego del último período es que cada uno se quede 3 meses en la cárcel. Si ahora queremos seguir con el procedimiento de inducción hacia atrás y derivar al juego reducido (conociendo el equilibrio de Nash del último subjuego) simplemente tenemos que adicionar 3 meses a cualquier juego del segundo período, porque sabemos que independientemente de lo que suceda en el segundo período, durante el tercero estarán 3 meses en la cárcel. En síntesis el siguiente diagrama muestra los pagos de cualquier juego (reducido) del segundo período: Pero entonces, ¿qué va a ocurrir en el período anterior, T-1=2? Nuevamente podemos derivar que en cualquier juego del período 2 lo óptimo es confesar para ambos jugadores, como se puede derivar del diagrama inmediatamente anterior. De hecho, qué ocurre en el juego del momento inicial, es simplemente reconocer que independientemente de qué decisión se tome en el momento 1 las decisiones involucradas desde el momento 2 en adelante implican 6 meses en la cárcel para cada participante y así el juego inicial debe incluir 3 meses adicionales al diagrama que se muestra en el segundo período. Es decir,

(6, 6) C 2 C NC (3, 7) 1 NC C (7, 3) 2 NC (5, 5)

Page 21: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

21

De nuevo, en el período 1 el juego reducido muestra que lo óptimo es confesar. En otras palabras, con argumentos de inducción hacia atrás llegamos a ver que el único equilibrio del juego es confesar todos los T períodos. Es decir, la estrategia es: Confesar en cada período y luego confesar independientemente de lo que haya ocurrido en períodos anteriores. El único equilibrio de Nash perfecto en subjuegos es confesar y por lo tanto la cooperación no tiene lugar en este tipo de juegos finitos. Esto es parte de un resultado más general:

• Teorema de Selten: Si un juego con un único equilibrio de Nash se juega un número finito de períodos, el único equilibrio en subjuego perfecto es ese equilibrio de Nash jugado en cada período.

De todas maneras corresponde destacar que esto no significa que no hayan otros equilibrios de Nash para este tipo de juegos repetidos, el tema es que estos equilibrios de Nash tienen problemas de credibilidad. Por ejemplo, la estrategia: Confesar en el primer período, confesar en períodos siguientes si el otro jugador confesó en el período anterior; caso contrario no confesar. Esta estrategia tiene el mismo resultado en términos de pagos como el equilibrio en subjuego perfecto. La imperfección surge sólo en el subjuego que aparece cuando ninguno de los dos confiesa. Si por error ninguno de los dos confiesa en el primer período, entonces enfrentarían un serio problema de credibilidad en el segundo período: la estrategia dice no confesar, pero tendrían un pago más alto por confesar.

B. Juegos repetidos infinitas veces Un juego se repite infinitas veces cuando no se sabe cuándo se acaba. Juegos como el ajedrez o un campeonato de fútbol son finitos porque se conoce con certeza una regla que establece que el juego se acaba. Por ejemplo en un campeonato de fútbol con 20 equipos se repite el juego (partido) 19 veces de local, 19 veces de visitante y se acaba el campeonato. Cuando no existe una regla como tal, y por lo tanto, las partes no saben por cuánto tiempo durará la interacción, se dice que el juego se repite infinitas veces. Un juego entre empleador y empleado en el que el empleado tiene un contrato a plazo indefinido y cada año discuten cómo se ajusta el salario es un juego que a efectos

(9, 9) C 2 C NC (6, 10) 1 NC C (10, 6) 2 NC (8, 8)

Page 22: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

22

de la teoría se repite infinitas veces. ¿Qué pasaría en el juego de la parte A si se repitiera infinitas veces? Previo a esto necesitamos conocer algunos conceptos de otras áreas, que nos permitirán comparar valores de distintos momentos del tiempo. ¿Vale lo mismo si les ofrezco US$1 hoy que dentro de 1 año? Seguramente lo preferirían hoy. ¿Porqué? Simplemente porque si se los doy hoy y lo depositan en el banco dentro de 1 año obtienen ese mismo dólar más el interés que les paguen por el depósito. Si por ejemplo 10% es la tasa de interés entonces el año que viene les darían US$1,1. Por lo tanto sí estarían indiferentes si les ofrezco US$1 hoy o US$1,1 el año que viene. Pero si les ofrezco US$ 1 el año que viene y quieren saber cuánto vale eso hoy simplemente tienen que preguntarse cuánto les tendría que pagar hoy para que el año que viene disfrutaran de US$1. Si les ofrezco US$0,9091 hoy y la tasa de interés es el 10%, entonces el año que viene luego de estar en el banco durante todo ese período tendrían US$1. Por lo tanto estarían indiferentes entre US$0,9091 hoy y US$1 el año que viene. Expresemos estas ideas matemáticamente: sea r la tasa de interés y M el monto de dinero que les doy hoy, entonces el monto de dinero que obtienen en el banco el año que viene (F) es: F = (1+r) M Y naturalmente se encontrarían indiferentes ustedes entre la alternativa que yo les ofrezca F unidades de dinero el año que viene o M unidades de dinero hoy. Fíjense que como la tasa r es positiva entonces siempre F es más grande que M. Ahora razonemos al revés. Si durante el año que viene yo les doy F dólares, ¿cuántos dólares valen hoy? Simplemente con un traspaso algebraico tenemos: M = (1/(1+r)) F (*) Compliquémosla un poco más. Supongamos que en lugar de darles F en 1 año, les prometo entregar F pero en dos años, ¿cuánto vale a dinero de hoy? Te entregan entonces F en 2 años, para valorarla al año 1 simplemente hay que aplicar la fórmula (*) una vez. Esa fórmula nos permite retroceder de a 1 período. Entonces el F entregado en el momento 2 vale (1/(1+r)) F al momento 1, pero si ahora quiero llevarlo del momento 1 al momento inicial, simplemente tengo que volver a aplicar la fórmula (*) sólo que ahora en lugar de F tengo (1/(1+r)) F. Así tenemos que si nos entregan F dentro de 2 años, hoy vale: M = (1/(1+r)) (1/(1+r)) F = (1/(1+r))2 F (**) Fíjense que si quisiéramos saber qué pasa si les entrego el dinero en 3 años el secreto para saber cuánto vale hoy está en elevar (1/(1+r)) al número de años que transcurren hasta que les entregue el dinero. En este caso si les entrego en 3 años, el valor a hoy es: M = (1/(1+r))3 F (***) Un poquito más. Ahora pensemos que les entrego F en 1 año, les vuelvo a entregar otro F en 2 años y nuevamente les vuelvo a entregar un tercer F en 3 años, ¿cuánto vale hoy todo este dinero? El primero F que entregué sabemos que vale hoy según (*), el segundo F está valorado según (**) y claramente el tercero por (***). Por lo tanto el valor a hoy es la suma de los tres conceptos: M = (1/(1+r)) F + (1/(1+r))2 F + (1/(1+r))3 F Pero esta ecuación se puede simplificar: M = [(1/(1+r)) + (1/(1+r))2 + (1/(1+r))3] F (****)

Page 23: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

23

Una complicación más y listo: Asuman que les ofrezco pagarles F todos los años para siempre. Ahora, la ecuación (****) se transforma para ser: M = [(1/(1+r)) + (1/(1+r))2 + (1/(1+r))3 + … ] F (*****) Para los que conocen series infinitas esta formula puede escribirse de una manera muy simple. Omito la demostración pero pueden verla en cualquier manual de matemática financiera. Finalmente queda: M = F/r (#) Esta es la ecuación de la “perpetuidad”. Es decir, si ofrezco otorgarles F a perpetuidad M es lo que tienen hoy. En términos prácticos si F es el arriendo de un departamento y el arriendo se los voy a pagar para siempre, entonces M es el valor que la vivienda tiene hoy, ya que es todo lo que espero recibir en concepto de pago de arriendos. Esto es todo lo que necesitamos saber de otra fuente. Volvamos entonces al ejemplo original, pero realicemos una pequeña transformación. En lugar de quedarse en la cárcel digamos que tienen que pagar millones de dólares. Es decir, un 3 en la matriz de pagos significa que por confesar tiene que pagar 3 millones de dólares, como fianza digamos. Recordemos que estamos en un juego infinito, es decir, un juego que no se sabe cuándo se va a terminar. Ahora evaluemos la siguiente estrategia: Estrategia trigger (disparador): NC en el primer período. NC en los períodos siguientes si el otro jugador jugó NC en el período anterior. C si alguna vez en el período anterior el otro jugador jugó C. ¿Conviene a Tchaikovsky usar esta estrategia para desarrollar cooperación? Para saber esto debemos evaluar las alternativas: confesar y no cooperar o no confesar y por lo tanto cooperar. ¿Cuál es el pago de cooperar? Si se coopera entonces en todos los períodos no van a confesar y por lo tanto en cada período tienen que pagar 2 millones. Fíjense que como el juego es infinito estos dos millones cada período son como el F a perpetuidad. Si queremos saber cuál es el monto de dinero al principio del juego que vamos a tener que pagar por cooperar simplemente aplicamos la fórmula (#). Mcoop (monto de cooperar) es: Mcoop = 2/r Ahora si no queremos cooperar, es decir, si queremos desviarnos del acuerdo de cooperación tenemos que buscar la mejor manera de hacerlo. Sabemos que una vez que confesemos eso implica que todos los períodos en adelante vamos a confesar. Entonces la pregunta es, ¿en qué período conviene dejar de cooperar y confesar? Supongamos que lo hacemos en el período 5, ¿cuánto ganamos por desviarnos? Si confesamos mientras que el otro no lo hace el gasto evitado llega a 3 millones porque si el otro no confiesa y nosotros sí, entonces no tenemos que pagar nada, mientras que si confesaba debía pagar 3 millones. Es decir me ahorro 3 millones en el período 5. Ahora la pregunta es, ¿me hubiera convenido no cooperar en el período 4 en lugar de hacerlo en el 5? Si hubiera confesado en el período 4 me ahorraba 3 millones del período 4. Pero sabemos que preferimos 3 millones en el período 4 que 3 millones en el período 5, por lo que claramente nos conviene hacerlo en el período 4. Y si seguimos así finalmente vemos que, si vamos a dejar de cooperar nos conviene desviarnos de la cooperación desde un inicio. ¿Cuál es el pago de desviarse desde un inicio? El primer período no tengo que pagar nada porque yo confieso mientras el otro no lo hace. Desde el segundo período en adelante tengo que pagar 3 millones por período porque rompí el acuerdo. ¿Cuánto es el valor a hoy de desviarse?

Page 24: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

24

Mno coop = 0/(1+r) + 3/(r(1+r)) = 3/(r(1+r)) Lo que queremos saber es si el monto que tenemos que pagar por cooperar es menor al que tenemos que pagar por no cooperar. Si ese es el caso, entonces conviene cooperar. Comparémolos entonces: Si se cumple que: Mno coop = 3/(r(1+r)) > 2/r = Mcoop entonces conviene cooperar. Finalmente lo que queremos saber es qué tasa de interés induce a los individuos a cooperar. Resolviendo esa ecuación vemos que si r < 50%, entonces conviene cooperar. Es decir, para tasas de interés relativamente bajas conviene a los jugadores sostener el acuerdo cooperativo.

• Ejercicio Resuelva el siguiente juego para 2 períodos y luego si se repitiera de manera infinita.

Jugador 2 C NC

C (1, 3) (0, 10) Jugador 1 NC (8, 2) (2, 0)

Page 25: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

25

Teoría de juegos

Séptima sesión

Emanuel Vespa

Resumen esquemático de los juegos revisados y sus conceptos de solución y juegos con

información incompleta

A. Resumen de los juegos ya revisados

Tipo de juego Ejemplo Concepto de solución Comentarios

Juegos estáticos con información

perfecta

2 C NC

C (3, 3) (0, 4)1 NC (4, 0) (2, 2)

Equilibrio de Nash en estrategias puras y mixtas

Juegos dinámicos con información

perfecta

2 (4, 2) 1 (0, 1) (3, 3)

Simplemente aplicando Inducción hacia atrás

Juegos dinámicos con información

imperfecta

Los jugadores 1 y 2 juegan un juego como el del primer ejemplo en el primer período y repiten el mismo juego durante

un segundo período. Cuando les toca decidir

en el segundo período no tienen información

perfecta acerca de lo que ocurrió en el período

anterior.

Equilibrio de Nash perfecto en subjuegos

Aquí se estudian juegos repetidos finitas

o infinitas veces

Este tipo de juegos son los que se han revisado hasta ahora en lo que va del curso.

B. Juegos con información incompleta Los juegos con información incompleta se dan cuando alguno de los jugadores no conoce los pagos que tiene el juego. En este caso, lo que se asume que conocen los jugadores es la probabilidad con la que pueden ocurrir los distintos pagos. Por ejemplo, una compañía de seguros de automóviles no sabe cuánto va a tener que pagar a los asegurados que choquen porque es imposible saber cómo serán los accidentes, pero puede determinar que para individuos que manejan imprudentemente la probabilidad de choque es 0,4 y para individuos que manejan prudentemente es 0,04. Si conoce el valor de un auto promedio, digamos 1 millón de pesos y tiene 100 asegurados, entonces así puede saber que si los individuos manejan prudentemente le costarán 4 millones, mientras que los imprudentes cuestan 40 millones. Ahora, cuando la empresa decide cuánto cobrarle a un individuo en particular no sabe si es prudente o imprudente y por lo tanto no conoce cuánto le costará entrar en un juego con esta persona. En este sentido el juego es de información incompleta. Otro caso es el de la subasta de un cuadro, que supongamos se lo lleva el que escribe el valor más alto en un sobre cerrado. En este caso si estoy participando y estoy decidido a llevarme el cuadro, a mí me gustaría saber cuánto es lo máximo que está dispuesto a pagar cada uno de los otros que participan de la subasta, de manera de escribir 1 centavo más que el más alto valor de los demás y

Page 26: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

26

así no perder plata de más. Pero el problema es que no conozco cuánto valoran el cuadro los demás. No conozco su función de pagos. Aunque no vamos a ver la resolución de este tipo de juegos sí podemos categorizarlos y brindar un sketch de la misma. Lo primero a distinguir es que pueden ser tanto estáticos como dinámicos. En el caso de la subasta es un juego estático: no conozco los pagos, pero al mismo tiempo que los demás debo escribir mi valoración en un papel. El caso de la compañía de seguros puede pensarse como un juego dinámico. La compañía de seguros puede no saber si es prudente o imprudente el solicitante, pero sí puede pedirle algún tipo de señal que le permita decidir y en tal caso juega después que el solicitante. Aunque el siguiente juego es de información completa pero imperfecta nos permite desarrollar una intuición acerca de cómo se resuelven los juegos con información incompleta. El juego en forma normal queda como:

Jugador 2 I' D'

I (2, 1) (0, 0) C (0, 2) (0, 1) Jugador 1 D (1, 3) (1, 3)

Este juego tiene dos equilibrios de Nash (I, I’) y (D, D’). Pero (D, D’) se basa en la amenaza no creíble que el jugador 2 jugará D’ si 1 juega C. El concepto de Equilibrio de Nash perfecto en subjuegos acá no aplica porque el único subjuego es el juego. Para resolver este juego hay que proceder en dos pasos. Requisito 1: en cada set de información el que decide debe formarse una conjetura. En este caso el que no sabe es el jugador 2 y consiste en decir que con probabilidad p se encuentra en el nodo de la izquierda y con probabilidad 1-p en el de la derecha. Requisito 2: Dadas las conjeturas debe decidir cuál estrategia le conviene más.

1 D (1, 3) I C 2 2 I’ D’ I’ D’ (0, 2) (0, 1) (2, 1) (0, 0)

Page 27: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

27

El beneficio esperado por jugar I’ dada la conjetura p es: 1p + 2 (1-p) = 2 – p El beneficio esperado por jugar D’ dada conjetura p es: 0 p + 1 (1-p) = 1 – p Pero 2 – p es siempre mayor a 1 – p. Por lo tanto al jugador 2 independientemente del valor de p siempre le conviene jugar I’ a D’. Si se exige que cada jugador tenga una conjetura y actúe coherentemente con ella, entonces se puede eliminar el equilibrio de Nash (D, D’). En los juegos con información incompleta hay que realizar una transformación, llamada transformación de Harsanyi que cambia juegos de información incompleta en juegos de información imperfecta. Si desconozco cuáles son los pagos de los jugadores, entonces se asume que hay una etapa previa en la que el azar (o la naturaleza) le revela a cada jugador cómo serán sus pagos pero no se los revela a los demás jugadores. Entonces los demás jugadores no conocen la historia completa del juego porque no saben qué ocurrió en la etapa en la que eligió la naturaleza y el juego de información incompleta se transforma en uno de información imperfecta. Luego para resolver este juego se utilizan conceptos similares a los desarrollados en el ejemplo anterior.

Page 28: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

28

Teoría de juegos

Octava sesión: Modelando con teoría de juegos

Emanuel Vespa

El objetivo de esta última sesión es aprender cómo pasar de una situación estratégica que puede describirse en prosa a la modelación con teoría de juegos. Para ello vamos a avanzar en distintos pasos, que irán siendo desarrolladas con un ejemplo puntual. Paso 1: Describir la situación en prosa Obviamente el primer esfuerzo debe focalizarse en presentar una discusión acabada del problema a tratar. Por ejemplo, veamos un esfuerzo para entender un aspecto de la violencia: la tenencia de armas. En EEUU mucha gente posee armas para su defensa. En Gran Bretaña casi nadie tiene armas. Una explicación proviene de las diferencias culturales. Otra es ver si podemos encontrar algún tipo de razón estratégica que sirva de justificativo. En ambos países la mayoría de la gente prefiere vivir en una sociedad desarmada, pero está dispuesta a comprar un arma si tiene razones para temer que los delincuentes vayan armados. Para los criminales, por otro lado, es claramente preferible que ellos estén armados y que sus víctimas no lo estén. Un hecho es que en Gran Bretaña el control sobre el uso de armas es muchísimo más estricto que en Estados Unidos. Paso 2: Identificar los jugadores Para mantener el juego lo más simple posible siempre es mejor tener el mínimo número de jugadores posibles, es decir, dos. En este caso los jugadores son muchos porque hay muchos delincuentes, hay muchos ciudadanos, se puede pensar que la policía también podría seguir algún tipo de estrategia, etc. Siempre conviene empezar entendiendo la estructura más simple posible. Una vez que se ha conseguido esto, se puede ver de adicionarle algún grado de complejidad que sea de nuestro interés. En el caso más simple lo mejor es comenzar asumiendo que hay dos jugadores: los delincuentes y los ciudadanos. Sí tenemos que tener claro lo siguiente: el juego que tienen los delincuentes y los ciudadanos en Estados Unidos tendría que tener algún tipo de diferencia con el juego que tienen delincuentes y ciudadanos en Gran Bretaña. Además esta diferencia tiene que asociarse a la única causa posible entre la información que tenemos: el control sobre uso de armas es más estricto en Gran Bretaña. Paso 3: Identificar las estrategias de los jugadores Si nos interesa estudiar cuántas armas tienen delincuentes y ciudadanos, podríamos pensar que la estrategia es la elección del número de armas. Así la variable de elección es continua: desde 0 hasta un número muy grande de armas (y terminemos en una sociedad con individuos tipo Rambo). Pero podemos captar los mismos resultados manteniéndonos en una estructura mucho más simple. Digamos que las estrategias posibles son: estar desarmado o estar armado. Esto implica dos

Page 29: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

29

estrategias puras y nos lleva a simplificar la situación respecto de una variable de elección continua. Pero cuidado, pueden haber casos en los que tal simplificación no nos sirve. La idea es simplificar siempre y cuando la elección tomada no impida analizar el problema fundamental que nos ocupa. En este caso la pérdida en riqueza de opciones no es lo suficientemente grande como para desincentivarnos la simplificación. En otros casos puede ocurrir lo contrario. Paso 4: Describir el tipo de interacción presente entre los jugadores: ¿Juego repetido o por única vez? ¿Juego secuencial o simultáneo? La primera pregunta en este paso es definir si el juego es repetido o no. ¿Es importante una estructura de juego repetido? En este caso, implicaría que en cada período los jugadores evalúan si deciden estar armados o no. Ahora, esto no parece tan razonable porque lo que nos interesa es describir porqué una sociedad es más armada que otra, no está puesto el centro en ver si es que hay procesos de arme y desarme en cada sociedad. Por lo tanto, en el presente ejemplo nos decidiríamos por la alternativa de jugar el juego una única vez. La segunda pregunta se refiere al orden de juego entre los jugadores. ¿Hay alguna razón para que sea secuencial? En tal caso deberíamos analizar qué jugador actúa primero. ¿Son los delincuentes los que se arman en primer lugar? ¿Es la ciudadanía la que decide y luego los delincuentes observan lo que la ciudadanía decide? Si leemos detenidamente la descripción en prosa, la respuesta a estas preguntas es lo que va a causar la diferencia entre Estados Unidos y Gran Bretaña. En Estados Unidos la decisión debe ser simultánea. Esto es lo que intuitivamente plantearíamos a priori. Los ciudadanos no pueden observar qué es lo que hacen los delincuentes y los delincuentes no pueden decidir luego de observar a los ciudadanos. En Inglaterra el fuerte cumplimiento de la ley puede hacer las cosas distintas: resultaría creíble para los ciudadanos pensar que los delincuentes han decidido no armarse porque saben que la ley es muy estricta y que no pueden hacerlo. En el caso inglés lo que tenemos es una decisión secuencial: primero eligen los delincuentes y luego los ciudadanos. Paso 5: Definir los pagos Definir los pagos puede implicar un grado de complejidad, por lo que es éste uno de los aspectos en los que hay que esforzarse para tenerlo lo más simple que sea posible. Lo primero es definir si conocemos los pagos o no. Recordar que si un jugador no conoce los pagos de otro, entonces es un juego de información incompleta. En este ejemplo, a priori podríamos decir que no conocemos los pagos. Pero nos podemos ir simplificando la situación. Sin importar cuál sea el pago que obtengan sí sabemos que los ciudadanos preferirían antes que cualquier otra cosa que tanto ellos como los delincuentes estén desarmados. Luego, preferirán que los ciudadanos estén armados y los delincuentes desarmados. En tercer lugar que ambos estén armados y la peor de todas las situaciones es que los ciudadanos estén desarmados y los criminales armados. Así, aunque no conocemos específicamente cuánto recibe cada jugador, sí podemos determinar un ranking de las alternativas: Los ciudadanos prefieren: 1º ambos desarmados 2º ciudadanos armados, delincuentes desarmados 3º ambos armados 4º ciudadanos desarmados, delincuentes armados.

Page 30: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

30

Ahora, con la misma lógica, veamos qué preferirían los delincuentes. Los delincuentes prefieren: 1º delincuentes armados, ciudadanos desarmados 2º ambos desarmados 3º ambos armados 4º delincuentes desarmados, ciudadanos armados. Podemos postular que tanto los ciudadanos como los delincuentes conocen todas estas alternativas. Por lo tanto aún cuando no conocemos los pagos específicos sí sabemos el orden que tendrán y eso es todo lo que es necesario para la resolución. Es decir, este es un juego de información completa. Definir los pagos no tiene una regla mecánica que se aplique a todos los casos, sino que caso a caso hay que determinar cuáles son las retribuciones de los jugadores. Dos aclaraciones adicionales pueden ayudar al plantear otros casos. Primero, supongamos que tenemos alguna duda en los pagos. Por ejemplo, no sabemos si los delincuentes prefieren segundo a ambos desarmados o a ambos armados. Entonces simplemente podemos resolver el juego con el otro orden y ver en qué cambia. Si la alteración de ese orden no lleva a modificaciones en el resultado, entonces nos quedamos tranquilos. Si hay algún cambio podemos buscar indagar por alguna otra vía cuál es el orden preciso. Segundo, en este caso particular parece no ser importante la utilidad asociada a un pago, aunque en muchos casos lo será. Supongamos que en otro caso podemos determinar un pago monetario a una situación, pero que pensamos que la persona puede valorar ese dinero de distinta manera, entonces podemos apelar al concepto de función de utilidad y postular cuál sería el resultado del juego, si por ejemplo, el dinero proviene de un robo y el jugador en cuestión es muy honesto y en lugar de sentir que posee más dinero siente una carga. Es decir, por ejemplo 1 millón adicional tiene una utilidad, digamos, de menos 10. Paso 6: Plantear el juego en forma normal o extensiva y buscar el criterio de resolución. En nuestro caso tenemos que comparar el resultado del juego en Estados Unidos con el que resulta de Gran Bretaña. Veamos primero la forma normal del juego en Estados Unidos a partir de lo que hemos descrito en pasos de 1 a 5.

Ciudadanos Desarmados Armados

Desarmados (2º, 1º) (4º, 2º) Delincuentes Armados (1º, 4º) (3º, 3º)

Como este es un juego simultáneo de información completa, entonces el concepto de solución es simplemente el Equilibrio de Nash. En este juego el equilibrio de Nash es que ambos estén armados. El tema es que los delincuentes tienen una estrategia dominante que es estar armados y dada esta estrategia dominante de los delincuentes los ciudadanos prefieren estar armados. Esto explica por qué puede ser que por una razón estratégica Estados Unidos tenga una sociedad con muchas armas. Ahora, notemos que a pesar de tener intereses opuestos ambos bandos prefieren el resultado en que nadie lleva armas (2º, 1º) al caso en que ambos están armados (3º, 3º).

Page 31: Curso Introducción a la Teoría de Juegos Apuntes Prof ...Curso Introducción a la Teoría de Juegos Apuntes Prof. Emanuel Vespa El propósito de este curso quedará cumplido si el

31

Ahora veamos la modelación para el caso de Gran Bretaña. Dijimos que aquí elegían primero los delincuentes y, luego observando lo que creíblemente habían decidido éstos, los ciudadanos realizaban su elección. Este juego, es por el contrario secuencial y por lo tanto hay que resolverlo con inducción hacia atrás. En este caso en los subjuegos finales los ciudadanos elegirán desarmarse si los delincuentes se desarman y elegirán armarse si los delincuentes se arman. En el subjuego reducido los delincuentes obtienen la segunda situación en preferencia si se desarman y la tercera si se arman. Por lo tanto deciden desarmarse y, como la ley es estricta, tal decisión es creíble. Lo que tenemos es que el equilibrio en Gran Bretaña es tal que ambos deciden estar desarmados. Si se mira para atrás algo insólito ocurrió en la transición de un juego en forma simultánea a uno secuencial. Los delincuentes escogieron prescindir de su estrategia dominante. En el juego de turno consecutivo la línea de decisión de los delincuentes afecta a la decisión de los ciudadanos. Armarse no es una estrategia dominante cuando el juego es secuencial.

Desarmarse (2º, 1º) Ciudadanos (4º, 2º)

Desarmarse Armarse Delincuentes (1º, 4º)

Armarse Desarmarse Ciudadanos Armarse (3º, 3º)