Tema: Desaprendizaje
2024
Evaluación de "Desaprendizaje" en Modelos de Lenguaje: Desafíos y Avances
Investigación revela que técnicas de desaprendizaje actuales fallan en eliminar completamente conocimientos peligrosos en modelos de lenguaje
2024
Resurgencia de Conceptos: Una Nueva Vulnerabilidad en Modelos de Difusión
Investigadores revelan cómo modelos de IA pueden reintroducir conceptos previamente olvidados, desafiando prácticas actuales de ajuste y desaprendizaje.