Científicos de la Universidad de Texas en Austin han desarrollado un innovador método que mejora la solución de juegos no cooperativos usando modelos de lenguaje preentrenados. Esta técnica se centra especialmente en juegos complejos y poco familiares, superando las limitaciones típicas del razonamiento y la memoria a largo plazo de estos modelos.
El método divide la solución de un juego en cuatro tareas incrementales: resumen del juego, selección de área, extracción de acción y validación de acción, cada una asignada a un agente de modelo de lenguaje específico. Para ello, utiliza un “árbol de pensamientos” para simular caminos de razonamiento, permitiendo a los agentes distilar representaciones del juego y tácticas colaborativamente.
Esta metodología aborda las limitaciones de los modelos de lenguaje al manejar juegos complejos creando un “árbol de pensamientos” que simula distintos caminos de razonamiento, eliminando la necesidad de razonar a través de todo el juego. Además, fomenta la colaboración multi-agente para la destilación de representaciones, permitiendo que cada modelo de lenguaje retenga información específica para la tarea con un crecimiento lineal de memoria, en lugar de una expansión exponencial.
Añadido a lo anterior, se ha creado un proceso de ajuste fino automatizado que permite optimizar el rendimiento de los agentes clasificando pares de consultas-respuestas basados en los resultados del juego. Este proceso consume significativamente menos muestras de entrenamiento que los algoritmos existentes de aprendizaje profundo, utilizando aproximadamente 1000 muestras en lugar de millones.
El método fue probado en un juego no cooperativo de nueva definición y demostró un 65% de tasa de victoria frente a algoritmos de referencia, mejorando un 10% adicional después de afinar el ajuste. La eficacia y escalabilidad del método queda patente al compararlo con los algoritmos de aprendizaje profundo que ahora demuestran ser computacionalmente costosos.
En conclusión, esta nueva técnica representa un avance significativo en la aplicación de modelos de lenguaje preentrenados para el juego, y establece un precedente prometedor para futuras investigaciones en la resolución de problemas complejos mediante técnicas computacionales de vanguardia.