Hasta hace unos años, la creación de poesía se consideraba un arte puramente humano. Sin embargo, el uso de modelos de lenguaje de gran tamaño (LLMs) como aquellos de OpenAI, específicamente GPT-3.5 y GPT-4, ha transformado esta percepción, abriendo nuevas posibilidades en el ámbito creativo. Un reciente estudio realizado por la Universidad de Washington investigó cómo estas inteligencias artificiales, especialmente ChatGPT, generan poesía, revelando tanto su capacidad como sus limitaciones.
Los investigadores utilizaron los modelos GPT-3.5 y GPT-4 para generar poemas en 24 estilos poéticos distintos, abordando alrededor de 40 temas diferentes. La meta era analizar la habilidad de estos modelos para emular formas poéticas tradicionales, como los sonetos y las villanelas. El estudio examinó un corpus de 5.7k poemas creados por los modelos y lo comparó con 3.7k poemas humanos de reconocidas instituciones poéticas.
Uno de los hallazgos más destacados fue la factibilidad de los modelos para crear poesía dentro de las convenciones de ciertas formas poéticas. Por ejemplo, en los sonetos, ambos modelos lograron constantemente alcanzar el número tradicional de 14 versos. Sin embargo, lo que sorprendió a los investigadores fue la tendencia uniforme observada en las producciones poéticas del GPT. Éstas, a menudo, incluían rimas y métricas iámbicas, siguiendo patrones regulares que ofrecen menos variabilidad y creatividad que las obras humanas comparadas.
En cuanto al estilo, los modelos proyectaban una especie de sello personal, carente en muchas ocasiones de la complejidad emocional y la riqueza expresiva humana. Palabras como “corazón”, “abrazo” o “eco” surgen con frecuencia, creando un vocabulario poético que, aunque efectivo, tiende a ser muy repetitivo y predecible.
Los resultados también revelaron que las producciones tienden a ser más uniformes en otras características como el uso de perspectivas. Se observó una clara predilección de los modelos por utilizar el punto de vista en primera persona del plural, reflejando un enfoque colectivo que podría estar influido por sus dinámicas de entrenamiento basado en múltiples fuentes.
El análisis de los poemas en cuanto a prosodia demostró que los modelos tienden a preferir estrofas de cuatro líneas, más conocidas como cuartetos, lo que contrasta con la diversidad de estructuras presentes en las obras poéticas humanas.
En conclusión, aunque los modelos GPT pueden generar poesía competente y atractiva desde un punto de vista superficial, todavía queda un largo camino para que alcancen la diversidad, la innovación y la profundidad emocional de sus pares humanos. La investigación proporcionará datos para futuras evaluaciones, y aunque las limitaciones de creatividad son evidentes, las posibilidades que ofrecen para el estudio y la tecnología poética son emocionantes y aún en expansión.