Un equipo de investigadores provenientes de diversas instituciones académicas ha desarrollado un nuevo marco denominado Flex-MoE, diseñado para enfrentar desafíos en el aprendizaje multimodal donde algunas modalidades de datos pueden faltar. Flex-MoE se diferencia de otros enfoques existentes que dependen de un único tipo de datos, al brindar flexibilidad y robustez incluso en situaciones de datos incompletos.
El procesamiento de Flex-MoE comienza con la identificación de las modalidades observadas en cada muestra y la utilización de codificadores específicos para cada modalidad. Posteriormente, el sistema completa las modalidades faltantes mediante un banco de modalidades faltantes que ofrece integraciones de datos observados junto con aquellos que faltan. Esto asegura que el modelo gestione los conjuntos de datos incompletos de manera efectiva.
El sistema aprovecha el diseño de Mixtures of Experts (MoE) que se combina con un router general (G-Router) y un router especializado (S-Router). El G-Router genera conocimiento a partir de muestras completas para proporcionar una base robusta, mientras que el S-Router se especializa en manejar combinaciones más reducidas de modalidades al asignar la máxima importancia al experto correspondiente a cada combinación observada.
Flex-MoE ha sido evaluado utilizando el conjunto de datos ADNI en el campo del Alzheimer, que incluye cuatro modalidades clave: imagen, genética, clínica y bioespecimen. También se realizaron pruebas con el conjunto de datos MIMIC-IV, demostrando que Flex-MoE ofrece un rendimiento consistente y robusto adaptado a diversas combinaciones de modalidades.
Los resultados muestran que Flex-MoE no solo puede manejar combinaciones arbitrarias de modalidades, sino que también mantiene un alto grado de rendimiento a pesar de la ausencia parcial de datos. Esto enfatiza la importancia de considerar las interacciones entre diferentes modalidades para una mejora efectiva en el diagnóstico y la predicción, principalmente en aplicaciones del ámbito médico.
Este avance sostiene que al explotar todas las combinaciones posibles de modalidades, se potencia la capacidad de enriquecerse de cada fragmento de información disponible, proporcionando un análisis más integral y detallado. Flex-MoE surge así no solo como una herramienta eficaz en contextos de datos faltantes pero también como un paso significativo hacia la maximización del potencial real del aprendizaje multimodal.