En un intento por evaluar las habilidades cognitivas espaciales de modelos multimodales avanzados, un grupo de investigadores ha desarrollado una serie de pruebas que confrontan a estos sistemas con desafíos basados en ciencia cognitiva clásica. El proyecto, denominado SPACE, se propone medir la competencia de estos modelos en tareas tanto de gran como de pequeña escala en el ámbito de la cognición espacial, confrontándolos con pruebas que incluyen desde esquemas de navegación hasta tareas de percepción visual.
Los resultados iniciales, basados en varios modelos multimodales modernos, muestran un desempeño inconsistente. Mientras que las máquinas demuestran ciertas capacidades en tareas específicas de comprensión del lenguaje, tropiezan significativamente en desafíos de cognición espacial clásica, como la estimación de distancias y direcciones.
El estudio exploró la habilidad de los modelos para crear representaciones mentales de su entorno, evaluar mapas y tomar atajos inéditos en diversos escenarios. A pesar de estos esfuerzos, los sistemas analizados lograron resultados que apenas superan el nivel del azar.
Por otro lado, tareas de pequeña escala como rotaciones mentales y juicios de orientación mostraron un rendimiento aún más desigual. Algunos modelos de lenguaje obtuvieron una precisión considerable en tareas de memoria visuoespacial, aunque, al enfrentar tareas que requieren habilidades totalmente integradas de percepción espacial, sus resultados fueron, una vez más, marginales.
Esta investigación revela un fenómeno intrigante: mientras que estos modelos exhiben alto desempeño en áreas de lógica tradicional y capacidad computacional, fallan en desafíos básicos relacionados con la cognición espacial, un área que en animales y seres humanos se considera fundamental para el desarrollo de habilidades cognitivas más avanzadas.
Este estudio plantea cuestiones significativas sobre el avance y la dirección futura del desarrollo de inteligencia artificial. La preocupación principal se centra en la disyuntiva entre alcanzar habilidades cognitivas avanzadas y la comprensión intuitiva de espacio y movimiento, un contraste que podría requerir una nueva perspectiva en la programación y entrenamiento de estos modelos.