Prerrequisitos: Teoría de Juegos
Cuando se discuten las estrategias de la teoría de juegos, a menudo se mencionan desde la perspectiva del jugador. Sin embargo, cuando las estrategias se forman desde el ángulo de un observador cuyo motivo principal es desear el mejor resultado para cada jugador; es decir, cuando las estrategias se forman desde un punto de vista socialmente equilibrado, el resultado se conoce como resultado óptimo de Pareto.
Se dice que un resultado es óptimo de Pareto si no puede ser dominado en el sentido de Pareto por ningún otro resultado. Para ser específico en la elección de un resultado de Pareto, es evidente que ningún otro resultado puede resultar mejor que este resultado para todos los jugadores. Además de esto, un jugador elige estrictamente el resultado óptimo de Pareto sobre cualquier otro resultado.
Por ejemplo, considere dos resultados con pagos a los dos jugadores como (5, 8) y (5, 6) . Aquí, es evidente que elegir cualquiera de los resultados no significaría ninguna diferencia para el jugador uno, ya que recibiría un pago de 5 de cualquier forma. Sin embargo, elegir el primer resultado cambiaría un poco las cosas a favor del jugador dos, ya que recibiría un 8 en lugar de un 6 . Por lo tanto, elegir el primer resultado significa que ambos jugadores obtienen el mejor pago posible y es por eso que este es el resultado óptimo de Pareto en este caso.
Consideremos algunos juegos populares de dos jugadores y analicemos el resultado óptimo de Pareto en cada uno de ellos:
- El juego de coordinación: el escenario de este juego es comparable a dos personas que caminan sobre el pavimento en direcciones opuestas. Si ambos optan por apegarse a su derecha o izquierda respectivas, resultará ventajoso para ambos. Sin embargo, si alguno de ellos se desvía de esta elección, son propensos a colisionar. La array de pagos de este juego es la siguiente: De la array anterior, está claro que los resultados (1, 1) son óptimos de Pareto para este juego.
- La batalla de los sexos: esto se puede considerar como una situación entre un esposo y una esposa. El esposo propone la idea de ir a un combate de boxeo y la esposa, por razones obvias, prefiere ir de compras al boxeo. Tienen intereses diferentes, pero lo más importante es que ambos quieren pasar el día juntos. Esto significa que la esposa iría al combate de boxeo con su esposo, donde terminaría recibiendo una recompensa de uno y el esposo disfrutaría de su recompensa de dos, en lugar de ir de compras solo, donde ambos recibirían una recompensa de cero. La array de pagos de este juego se ve así: Por lo tanto, podemos observar que (2, 1) y (1, 2) son los resultados óptimos de Pareto en este caso.
- El juego Matching pennies: El objetivo del juego es diferente para los dos jugadores. Ambos jugadores reciben monedas con dos caras, una cara y una cruz. El jugador uno debe tratar de hacer coincidir su centavo con el del jugador dos y el jugador dos debe asegurarse de que su centavo no coincida con el del jugador uno. Entonces, en los casos en que los centavos coincidan, el jugador uno obtiene un pago positivo y el jugador dos obtiene un pago negativo igual. Por el contrario, en caso de desajuste, el jugador dos recibe un pago positivo y el jugador uno, uno negativo. La array de pagos dada lo demuestra mejor:
En este juego, si el jugador uno elige jugar cara, el jugador dos obviamente respondería con cruz. Nuevamente, si el jugador dos elige cruz, el jugador uno estaría interesado en jugar cruz para ganar y estas elecciones se repetirían de manera cíclica. Por lo tanto, es evidente que la decisión de cada jugador está directamente influenciada por la del otro y no existe una estrategia dominante que cualquier jugador elija para ganar. Como resultado, todos los resultados en la array de pagos son esencialmente óptimos de Pareto, lo cual es bastante común en el caso de los juegos de suma cero. - El dilema del prisionero : Consideremos dos prisioneros que son condenados por un determinado delito. Debido a cierta falta de pruebas, los presos son condenados a un año de prisión únicamente. Ahora se habla con ambos prisioneros en confianza y se les ofrece ser puestos en libertad si traicionan al otro. Sin embargo, la persona que es traicionada ahora recibe una pena de prisión de diez años, que es una recompensa negativa mayor. Además, si ambos presos se traicionan mutuamente, ambos son condenados a cinco años de prisión cada uno.
Es bastante intrigante que los resultados (-1, -1), (0, -10) y (-10, 0) sean todos óptimos de Pareto para este juego. El resultado (-5, -5) no es óptimo de Pareto ya que está dominado por el resultado (-1, -1) de Pareto. Otra observación interesante para hacer es que (-5, -5), que es el único resultado óptimo no Pareto en el juego, también es la estrategia dominante que se espera que juegue cada jugador, lo que lo convierte en el equilibrio de Nash . ¡Por eso el dilema del prisionero es un dilema tan grande!
Publicación traducida automáticamente
Artículo escrito por arjunmanjunath y traducido por Barcelona Geeks. The original can be accessed here. Licence: CCBY-SA