La IA de Meta vence a los humanos en un juego de mesa clásico


Los investigadores de Meta dieron a conocer el algoritmo Cicero AI que puede jugar el juego de mesa diplomático a nivel humano. registro lo escribe.

La “diplomacia” se desarrolló en 1953. El juego se centra en la comunicación y negociación entre los participantes. Cada uno de ellos desempeña el papel de una de las siete naciones de Europa a principios del siglo XX.

Básicamente, Cicero es un chatbot que puede negociar con otros actores para tomar acciones efectivas. El algoritmo se basa en un modelo de lenguaje similar a BART con 2700 millones de parámetros.

Está previamente entrenado en texto de Internet y un conjunto de datos de más de 40,000 juegos de diplomacia en línea. El conjunto de datos contiene más de 12 millones de mensajes intercambiados entre personas durante la competencia.

Una captura de pantalla del juego “Diplomacia” del agente AI Cicero. datos: meta.

La salida de diálogo del agente de IA está vinculada a su módulo de pensamiento estratégico. Con él, Cicerón creó “intenciones”, que representan una serie de acciones que podrían realizar diferentes jugadores.

“El Módulo de Pensamiento Estratégico Anticipa las Políticas de Otros Actores [вероятные действия] Según el estado de la junta y las acciones actuales de la conversación general, elige por sí mismo la política de las acciones actuales”, dijeron los investigadores.

A diferencia de los agentes de IA para el ajedrez, los investigadores aplicaron el aprendizaje supervisado utilizando datos de juegos anteriores. Sin embargo, el método en sí mismo crea un modelo crédulo que puede ser fácilmente manipulado por jugadores sin escrúpulos, dijeron los investigadores.

Para evitar esto, los desarrolladores conectaron el algoritmo de planificación iterativa piKL a Cicero. Con él, el agente de IA refina las predicciones iniciales sobre las estrategias de otros jugadores y las acciones planificadas en base a conversaciones entre bots y humanos. El algoritmo intenta mejorar el conjunto de acciones esperadas del participante evaluando diferentes opciones que proporcionarán el mejor resultado.

Durante dos meses, los investigadores probaron a Cicero en 40 juegos de diplomacia anónima. Según los resultados de la prueba, el agente de IA ingresó al 10% superior de los participantes que actuaron más de una vez. El algoritmo ocupa el segundo lugar entre los usuarios que han jugado cinco o más juegos.

En los 40 juegos, Cicero está disparando un 25,8 por ciento desde el campo, más del doble del promedio de 12,4 por ciento de sus 82 oponentes.

El campeón mundial diplomático Andrew Grove elogió el algoritmo por su genial enfoque del juego.

“Mucha gente suavizaría su actitud o se vengaría, pero Cicerón nunca hizo eso. Simplemente tomó la situación de acuerdo con su percepción. Así que fue despiadado en la ejecución de sus tácticas, pero no del tipo que molestaría a otros jugadores”. ,” él dijo.

Según los desarrolladores, Cicero todavía comete algunos errores. Sin embargo, esperan que su investigación sea útil para otras aplicaciones, como chatbots para conversaciones prolongadas o personajes de videojuegos realistas.

Meta también libera el código fuente de Cicero para que cualquiera pueda contribuir a su desarrollo.

Recuerde que en noviembre, el gigante tecnológico cerró AI for Science tres días después de su lanzamiento. El algoritmo ha sido acusado de generar falsificaciones y desinformación.

Suscríbase a las noticias de ForkLog en Telegram: ForkLog AI – Todas las noticias del mundo de la IA

¿Encontró un error en el texto? Selecciónalo y presiona CTRL+ENTER

Fuente de información: compilado de FORKLOG por 0x Information.Los derechos de autor pertenecen al autor Богдан Каминский, y no deben ser reproducidos sin permiso.

Total
0
Shares
Related Posts

El comercio de futuros de Bitcoin de Bakkt aumentó 3100%

Después del lanzamiento decepcionante de lotes pequeños, la plataforma Bakkt comenzó a ganar impulso. El jueves 10 de octubre, Bakkt informó que se negociaron 224 contratos de bitcoins, equivalentes a aproximadamente R $ 7,5 millones. Esta cifra es 3100% más alta que…
Lee mas