En una era donde la accesibilidad a la información es crucial, los textos en formato de Lectura Fácil desempeñan un rol fundamental, especialmente para personas con dificultades lectoras. Autores como Jesús Calleja, Thierry Etchegoyhen y David Ponce han centrado sus esfuerzos en desarrollar métodos automatizados para segmentar estos textos, utilizando modelos de lenguaje avanzados y técnicas de análisis de constituyente.
Tradicionalmente, el contenido en formato Lectura Fácil debía adecuarse dividiendo las oraciones en segmentos más pequeños y comprensibles, permitiendo así una lectura más fluida. Sin embargo, hasta ahora, automatizar este proceso había resultado un desafío no del todo resuelto. Este equipo ha abordado la tarea de evaluar métodos novedosos, desarrollando hipótesis de segmentación con limitados o nulos datos de entrenamiento, centrándose en los modelos de lenguaje amplios generativos y en técnicas de puntuación basadas en modelos de lenguaje enmascarados (MLM).
Los investigadores condujeron una serie de evaluaciones tanto automáticas como humanas en los idiomas vasco, inglés y español. Dichas evaluaciones compararon los potenciales y limitaciones de estas nuevas alternativas en escenarios con recursos escasos, destacando ciertas carencias en comparación con las segmentaciones realizadas por expertos. Asimismo, el equipo creó conjuntos de datos centrados en la segmentación en estos lenguajes para promover el desarrollo del campo.
Los resultados sugieren que las aproximaciones basadas en modelos de lenguaje enmascarado son una alternativa viable según varias métricas de evaluación. No obstante, como era de esperar, estos métodos aún no alcanzan la calidad de las segmentaciones realizadas por humanos expertos, lo que marca un área de mejora potencial para futuras investigaciones.
En conclusión, la implementación exitosa de métodos automatizados de segmentación de textos en formato de Lectura Fácil podría mejorar significativamente el acceso a la información para poblaciones que lo necesiten, aunque todavía se necesita de la intervención y juicio humano para alcanzar niveles de comprensión óptimos. El estudio destaca tanto los avances logrados como los desafíos pendientes en el ámbito de la tecnología inclusiva y su aplicación en la creación de contenidos accesibles.