Solo noticias

y ya

viernes 11 de de 2024

Veredicto de las Máquinas: Clasificadores Desenmascaran Imágenes Generadas

La reciente investigación realizada por Zebin You y su equipo en las instituciones académicas y tecnológicas de China y Australia ha arrojado luz sobre las capacidades de los modelos generativos de imágenes, particularmente los modelos de difusión. Aunque a simple vista, las imágenes generadas por estos modelos pueden parecer indistinguibles de las reales para el ojo humano, un análisis detallado utilizando clasificadores basados en redes neuronales sugiere lo contrario.

Los modelos de difusión han avanzado considerablemente en la calidad visual de las imágenes generadas, igualando, incluso superando en ocasiones, a métodos como las redes generativas adversariales (GAN) y los autoencoders variacionales. Sin embargo, cuando se enfrentan a la tarea de clasificación, los clasificadores logran identificar con más de un 98% de precisión la diferencia entre imágenes reales y generadas, incluso utilizando un bajo número de muestras de entrenamiento.

De manera reveladora, los clasificadores muestran dificultades para distinguir entre modelos de difusión de la misma familia, como EDM2-XS y EDM2-XXL, a pesar de sus diferencias en el número de parámetros y los puntajes FID (Frechet Inception Distance), que miden la similitud de distribución entre imágenes generadas y reales. No obstante, cuando se trata de modelos diferentes que poseen similares puntajes FID, los clasificadores responden con alta precisión, mientras que los juicios humanos tienden a la aleatoriedad en estos casos.

Además de la clara utilidad para la validación de modelos de difusión, estos descubrimientos introducen implicaciones significativas para el uso de datos generados en entrenamientos posteriores. En casos de formación continua donde se usa principalmente datos generados, el tropiezo conocido como “desorden de autodevoración del modelo” parece inevitable cuando se ignora la discrepancia de distribución existente.

A partir de estas conclusiones, se destaca la importancia de seguir complementando el conjunto de datos reales con aquellos generados, en lugar de reemplazarlos completamente, para preservar la calidad y la diversidad de los modelos en aplicaciones de aprendizaje tanto supervisado como semi-supervisado.