En un esfuerzo por comparar las capacidades cognitivas de los modelos de inteligencia artificial generativa (GenAI) con las habilidades humanas, un estudio reciente ha evaluado el rendimiento de modelos líderes en inteligencia general contra el estándar de las pruebas de inteligencia humana. Utilizando el índice de Inteligencia Wechsler IV (WAIS-IV), ampliamente reconocido, esta investigación arrojó luz sobre las impresionantes capacidades y las limitaciones de estos sistemas tecnológicos.
Los resultados han sido sorprendentes en algunos aspectos y decepcionantes en otros. Los modelos evaluados demostraron capacidades sobresalientes en la manipulación y recuperación de información almacenada, alcanzando o superando el percentil 99.5 en el Índice de Memoria de Trabajo (WMI). Este desempeño ilustra su firme habilidad para gestionar conceptos abstractos cuando se trata de datos secuenciales como números o letras, reflejando un superlativo procesamiento de la memoria, incluso en condiciones de alta complejidad.
En el ámbito de la comprensión verbal, medida a través del Índice de Comprensión Verbal (VCI), muchos modelos mostraron una destreza excepcional, situándose en el percentil 98 o superior. Esto indica que estas inteligencias artificiales son bastante competentes en entender y relacionar conceptos lingüísticos, acercándose al nivel de la habilidad humana normativa en el uso y la comprensión del lenguaje.
Sin embargo, el escenario cambió drásticamente cuando se trataba de habilidades de razonamiento perceptual. Aquí, los modelos multimodales exhibieron un desempeño deficiente, con resultados generalmente en el percentil 0.1 al 10. Este déficit indica una notable incapacidad para procesar y razonar sobre información visual, lo cual es un desafío significativo para el avance de la inteligencia artificial hacia modelos más generalizados.
Los hallazgos también evidencian que las versiones más pequeñas y antiguas de estos modelos se ven superadas sistemáticamente por las versiones más nuevas en términos de capacidad cognitiva, sugiriendo que el crecimiento en la cantidad de parámetros y mejoras en el ajuste de entrenamiento están correlacionados con avances sustanciales.
Estas conclusiones subrayan la complejidad y multifacético panorama que enfrenta la inteligencia artificial en su camino hacia un acoplamiento de capacidades humanas, destacando áreas críticas que requieren más investigación, como el razonamiento visual. Con el tiempo, estos estudios no solo promueven avances en la creación de modelos IA más comprensivos y competentes, sino que también plantean importantes consideraciones éticas y prácticas sobre el rol de la inteligencia artificial en diferentes aplicaciones sociales.