Tema: Multimodal
2024
VLM2Vec: Innovando los Embebimientos Multimodales
Un nuevo modelo genera avances significativos en tareas que integran texto e imágenes usando MMEB
2024
TV-TREES: Innovador Sistema de Comprensión Multimodal para Videos
La Universidad Johns Hopkins presenta TV-TREES, una solución pionera que descompone complejidad en la comprensión de videos mediante árboles de implicación multimodal, logrando resultados sobresalientes.