Tema: Ataques De Jailbreaking

2024

oct. 14

Investigadores incrementan la efectividad de ataques contra LLMs manipulando el enfoque de atención de los modelos.