Tema: Ataques De Jailbreaking
2024
Avances en Jailbreaking para Modelos de Lenguaje: Optimización del Control de Atención
Investigadores incrementan la efectividad de ataques contra LLMs manipulando el enfoque de atención de los modelos.
Investigadores incrementan la efectividad de ataques contra LLMs manipulando el enfoque de atención de los modelos.