Tema: Evaluación Adversarial
2024
Evaluación de "Desaprendizaje" en Modelos de Lenguaje: Desafíos y Avances
Investigación revela que técnicas de desaprendizaje actuales fallan en eliminar completamente conocimientos peligrosos en modelos de lenguaje
Investigación revela que técnicas de desaprendizaje actuales fallan en eliminar completamente conocimientos peligrosos en modelos de lenguaje