Solo noticias

y ya

lunes 14 de de 2024

Revolución en la Respuesta Automática de Preguntas con Sentido Común y Conocimiento Verificable

El auge de los Modelos de Lenguaje de Gran Escala (LLMs, por sus siglas en inglés) se está consolidando como una herramienta crucial en la mejora de los procedimientos de Respuesta a Preguntas de Grafos de Conocimiento (KGQA). Sin embargo, muchas de estas metodologías desarrolladas hasta el momento se enfrentan a desafíos significativos cuando se confrontan con preguntas que requieren un razonamiento de sentido común. Este problema se agrava especialmente al tratarse de entidades de baja frecuencia, o recientes, donde la capacidad de razonamiento se ve obstaculizada por la introducción de información incorrecta o infundada, lo que se conoce como “alucinaciones”.

Para abordar estos desafíos, el equipo de investigación de la Universidad de Toronto ha desarrollado un enfoque innovador llamado “Right for Right Reasons” (R3). Este método propone un proceso de razonamiento verificable que permite enfrentar preguntas de conocimiento común y fácticas de manera más eficaz y precisa. Mediante experimentos en tareas diversas como la verificación de afirmaciones, la comparación de preferencias basadas en KG y la respuesta a preguntas, R3 ha demostrado no solo reducir significativamente las alucinaciones y errores de razonamiento, sino también mejorar la precisión.

Un aspecto fundamental de R3 es su capacidad para enfrentar no solo preguntas clásicas sobre hechos, como “¿En qué ciudad nació la primera esposa de Silvio Berlusconi?”, sino también preguntas que requieren una combinación de hechos y razonamiento de sentido común, logrando evitar errores comunes que los métodos anteriores no han podido soslayar.

El compromiso de R3 con un enfoque verificable implica que cada paso de razonamiento está sustentado en tríplices de grafos de conocimiento relevantes, eliminando así la incertidumbre y mejorando la fiabilidad de las respuestas. Aunque su diseño está principalmente centrado en mejorar el rendimiento en la respuesta a las preguntas basadas en grafos, su robustez y versatilidad le permiten adaptarse a un amplio rango de aplicaciones del mundo real, desde el ámbito sanitario hasta sistemas de recomendaciones.

Los hallazgos han sido prometedores: R3 no solo ha demostrado superar metodologías previas en cuanto a su exactitud y solidez frente a cambios en la popularidad de entidades, sino que ha abierto las puertas a futuras extensiones para abordar un espectro más amplio de tareas, mejorando la confiabilidad y la accesibilidad de los sistemas de razonamiento basados en LLM.