Esta máquina puede vencer a los mejores jugadores de póker del mundo

Forbes México.
Esta máquina puede vencer a los mejores jugadores de póker del mundo

Por Sam Shead

Es posible que sea hora de que los jugadores de póker cambien sus fichas, luego de que los investigadores de Facebook y Carnegie Mellon crearon un robot de inteligencia artificial (IA) que puede vencer a los mejores jugadores profesionales (humanos) en el póquer Texas Hold’em, sin límite, para seis jugadores; la forma más popular de este juego de cartas.

El poker ha sido considerado como un “gran desafío” en el campo de la IA. El hecho de que el juego implique información oculta (no sabes las cartas de tus oponentes) significa que el éxito requiere bluff y otras tácticas que no se aplican en otros juegos. Esto ha hecho que el póquer sea resistente a las técnicas de IA que han producido avances en otros juegos. Los investigadores han podido desarrollar IA que puede vencer a otro jugador en el Texas Hold’em Poker, pero en la modalidad multijugador ha sido demasiado difícil de descifrar.

Conocido como: Pluribus, la IA de Facebook fue creada por el científico investigador, Noam Brown, y el profesor de la Universidad Carnegie Mellon, Tuomas Sandholm. Fue descrito en un artículo académico publicado el jueves pasado en la revista Science. 

Pluribus dominó el Texas Hold’em, en su versión de multijugador, enfrentando versiones anteriores de sí mismo. Este método de aprendizaje “self-play” significa que no se alimentó con datos de humanos y que tampoco observó los juegos jugados por otros sistemas de inteligencia artificial.

“La IA comienza de cero al jugar al azar y mejora gradualmente a medida que determina qué acciones y qué distribución de probabilidad sobre esas acciones conducen a mejores resultados frente a versiones anteriores de su estrategia”, escriben Brown y Sandholm en su artículo. Esta estrategia ha sido utilizada antes. Por ejemplo, Google DeepMind lo usó para descifrar Go, y OpenAI lo usó para dominar Dota 2.

También lee: El uso de Inteligencia Artificial para combatir fraudes crecerá 200%

Los investigadores inteligencia artificial han estado utilizando los juegos como un banco de pruebas para sus agentes durante décadas y en los últimos años ha habido una serie de avances, gracias a la tecnología en computación, mejores conjuntos de datos y técnicas de IA más sofisticadas. Los gigantes de la tecnología están invirtiendo fuertemente en este espacio, con la esperanza de que los avances en el juego conduzcan a otras áreas como la salud, la ciencia y la energía.

“Estas innovaciones tienen implicaciones importantes más allá del póquer, porque las interacciones de suma cero para dos jugadores (en las que un jugador gana y otro pierde) son comunes en los juegos recreativos, pero son muy raros en la vida real”, escriben los investigadores en un blog. “Los escenarios del mundo real, como hacer una oferta en una subasta en línea o navegar por el tráfico, generalmente involucran a múltiples actores”.

Pluribus superó a los mejores jugadores profesionales en distintos formatos. De lo que destacan, Chris Ferguson, el campeón de la World Series of Poker, y Darren Elias, un profesional estadounidense que tiene el récord de ganar la mayoría de los títulos del World Poker Tour.

No había dinero en juego, pero los investigadores afirman que si cada ficha valiera un dólar, Pluribus habría ganado un promedio de alrededor de 5 dólares  por mano y habría ganado alrededor de 1,000 dólares por hora, jugando contra cinco humanos.

Pluribus es una versión sobrealimentada de otro bot de IA, llamado Libratus, que venció a los profesionales humanos en los juegos de dos jugadores de Texas Hold’em en 2017.

A diferencia de Libratus, Pluribus contiene un nuevo algoritmo de búsqueda en línea que puede evaluar sus opciones mediante la búsqueda de algunos movimientos futuros, así como algoritmos de reproducción automática más rápidos.

La combinación de estos dos factores hizo posible entrenar a Pluribus usando relativamente poco poder de procesamiento y memoria. Los investigadores dicen que solo requerían 150 dólares en recursos de computación en la nube. “Esta eficiencia está en marcado contraste con otros proyectos recientes de AI, que requirieron el equivalente de millones de dólares en recursos informáticos para entrenar”, escribieron.

Lo que dicen los profesionales

“Pluribus es un oponente muy difícil con el que jugar”, dijo Ferguson. “Es muy difícil sujetarlo en cualquier tipo de mano. También es muy bueno para hacer apuestas de poco valor y extraer valor de sus buenas manos”.

Elias agregó que la principal fortaleza de Pluribus es su capacidad para usar estrategias mixtas, que es lo que los humanos intentan hacer.

“Es una cuestión de ejecución para los humanos: hacer esto de una manera perfectamente aleatoria y hacerlo de manera consistente”, dice.

“La mayoría de la gente simplemente no puede. El bot no estaba simplemente jugando contra algunos profesionales. Estaba jugando con algunos de los mejores jugadores del mundo”.

Si bien Pluribus podría enviar un escalofrío a los jugadores de póker profesionales que se ganan la vida ganando torneos en línea, no tienen que preocuparse por enfrentarse a Pluribus en su próximo partido.

“No estamos abiertos al mercado (…) una razón por la que no lo hacemos es que el póquer se juega comercialmente y sentimos que el suministro abierto podría tener un impacto negativo en la comunidad”, dijo el portavoz de Facebook Ari Entin a Forbes.

No te pierdas: Estrategia Nacional de Inteligencia Artificial va por sentido ético y responsable

Esta máquina puede vencer a los mejores jugadores de póker del mundo
Forbes Staff

en_USEnglish