Investigadores de la Escuela de Ingeniería y Ciencias del Tecnológico de Monterrey en colaboración con la Universidad de Leeds han desarrollado un innovador método que mejora el rendimiento de los modelos de segmentación de imágenes endoscópicas cuando estos enfrentan datos fuera de su distribución habitual. Este avance tiene un impacto significativo en el diagnóstico de cáncer gastrointestinal (GI), donde se registran un millón de casos nuevos anualmente y donde la endoscopia juega un papel crucial en la identificación de estas enfermedades.
La mayoría de los modelos de visión computacional actuales tienden a fallar al analizar imágenes endoscópicas que no corresponden a la distribución de datos con los que fueron entrenados originalmente. Esto es un obstáculo crítico, ya que la falta de generalización podría resultar en detecciones fallidas de lesiones potencialmente precancerosas al cambiar el modo de la imagen o las condiciones del paciente.
El equipo de investigación ha propuesto el uso de técnicas avanzadas de normalización de características y mapeo de covarianza para asegurar que los modelos sean robustos y capaces de reconocer características importantes en entornos diferentes a los de su entrenamiento inicial. Esto incluye la introducción de un módulo de restitución que permite mantener las características relevantes para la tarea, mejorando así la tasa de éxito de los modelos ante modalidades de imagen no vistas.
Los resultados del estudio mostraron una mejora del 13.7% en el rendimiento sobre el modelo base DeepLabv3+ en el conjunto de datos EndoUDA dedicado a la detección de pólipos, y un incremento del 8% respecto a los métodos más avanzados del estado del arte. De igual manera, en el caso de esófago de Barrett, el nuevo enfoque logró una mejora del 19% sobre el modelo base.
Es digno de destacar que este método no solo se limita a las imágenes endoscópicas de un tipo específico sino que demuestra ser altamente generalizable a otras modalidades de imagen, lo que reafirma su potencial para ser utilizado en una amplia gama de aplicaciones médicas. Esta capacidad de generalización es fundamental para el desarrollo de sistemas diagnósticos basados en inteligencia artificial que sean más precisos y menos dependientes de las variaciones de los datos.
En conclusión, los métodos propuestos por estos investigadores no solo mejoran la comprensión de las imágenes endoscópicas, sino que también representan un paso significativo hacia la creación de herramientas de diagnóstico más fiables y eficientes, que pueden revolucionar el campo de la detección del cáncer y salvar vidas al garantizar una detección temprana más precisa.