Solo noticias

y ya

martes 22 de de 2024

Avances en la Planificación de Trayectorias de Conducción Automatizada Urbana

Un equipo de investigación de la Universidad de Chongqing, China, ha propuesto un método innovador para planificar trayectorias de conducción automatizada en entornos urbanos. Utilizando un enfoque que integra aprendizaje por refuerzo (RL) y aprendizaje por imitación, han desarrollado una técnica que permite una planificación de múltiples pasos, superando las limitaciones de los métodos actuales que sólo razonaban un paso por delante.

El aprendizaje por refuerzo ha enfrentado desafíos significativos en la planificación de trayectorias, principalmente debido a su pobre convergencia y a las dificultades en el diseño de funciones de recompensa. Para abordar estos problemas, los investigadores han optado por combinar RL con aprendizaje supervisado, logrando aliviar los problemas de convergencia. Sin embargo, las metodologías actuales limitaban la planificación en escenarios urbanos debido a la sencilla estructura lineal del diseño de funciones de recompensa.

El equipo introdujo un método de planificación híbrido, el “Reinforced Imitative Trajectory Planning” (RITP), que combina RL con aprendizaje por imitación, permitiendo realizar planes de múltiples pasos en entornos urbanos complejos. Además, desarrollaron una función de recompensa basada en un transformador con capacidad bayesiana, que proporciona señales de recompensa efectivas para el aprendizaje por refuerzo en escenarios urbanos.

La técnica fue validada utilizando el extenso conjunto de datos “nuPlan”, que contiene datos de conducción automatizada urbana reales. Los resultados mostraron una mejora significativa en las métricas de evaluación frente a métodos previos, lo que subraya la eficacia de la planificación basada en bucle cerrado que impide las evaluaciones de trayectorias en línea, reduciendo así la complejidad computacional.

Como conclusión, esta investigación representa un avance significativo en la conducción automatizada urbana. Proporciona un método más robusto y efectivo para la planificación de trayectorias, reduciendo el riesgo de suboptimalidad y mejorando la interpretación y la seguridad de las trayectorias calculadas.