Un nuevo sistema automatizado ha sido desarrollado por un grupo de investigadores del Instituto de Cartografía y Geoinformación de ETH Zúrich para mejorar la generación de captions en mapas históricos. Este avance se presenta como una solución innovadora frente a las limitaciones de los métodos previos de texto imagen existentes como CLIP y ClipCap, adaptándolos para captar mejor las particularidades de los mapas.
La iniciativa surge de la necesidad de comprender mejor los mapas históricos, los cuales, debido a sus proyecciones no estándar, símbolos artísticos y estilos de dibujo a mano, resultan complicados de interpretar para quienes no son expertos en la materia. En anteriores intentos, los modelos pre-entrenados fallaban al interpretar de manera precisa estos mapas porque su aprendizaje inicial no incluía suficiente exposición a imágenes de mapas.
Para superar estos desafíos, los investigadores optaron por un enfoque innovador que combina el ajuste fino del modelo CLIP para generar captions relevantes y GPT-3.5 para enriquecerlas, creando así narrativas breves y completas. Este método ha demostrado ser más preciso en crear historias amplias sobre mapas al ofrecer información sobre el “dónde”, “qué”, “cuándo” y “por qué” del contexto del mapa.
El equipo ha procesado más de 4,500 mapas, diferenciando entre mapas topográficos y pictóricos, y utilizando un novedoso árbol de decisiones para personalizar los captions según el tipo de mapa. Esta metodología no solo destaca por su precisión, sino también por su eficiencia y flexibilidad, pudiendo adaptarse a otros tipos de mapas más amplios y completarse con pocas modificaciones.
Los resultados muestran que el sistema mejorado supera considerablemente al modelo base CLIP en términos de precisión de las captions generadas. De las seis categorías analizadas, el nuevo sistema consiguió tasas de precisión más altas en cinco, destacándose especialmente en identificar categorías y épocas precisas de los mapas, lo que CLIP no lograba con la misma eficacia.
Este avance no solo promete mejorar la interpretación de mapas históricos para fines académicos y culturales, sino que también abre la puerta a futuras investigaciones que puedan ajustar y extender el uso de este sistema a contextos aún más específicos dentro del vasto espectro de la cartografía histórica.