La investigación y desarrollo en el ámbito de los sistemas de conducción autónoma han dado un salto significativo con la introducción de nuevas metodologías para planificación de movimiento. Investigadores han aprovechado datasets de conducción en el mundo real para mejorar las capacidades de generalización de los planificadores de movimiento impulsados por datos. La innovación reciente se centra en la arquitectura Mixture of Experts (MoE) acoplada con Transformers causales, cuyo objetivo es mejorar la generalización en situaciones complejas y de pocos ejemplos.
Tradicionalmente, los enfoques de planificación se han visto limitados por diseños excesivamente complejos o limitaciones en los paradigmas de entrenamiento. Los resultados experimentales más recientes muestran que con un adecuado escalamiento, varios elementos del diseño se vuelven superfluos. El modelo StateTransformer 2 (STR2) propone un modelo escalable que, mediante un codificador Vision Transformer (ViT) y un backbone de expertos múltiples, busca resolver problemas de colapso de modalidades y balanceo de recompensas.
Los experimentos realizados con el dataset NuPlan han demostrado que este enfoque mejora significativamente la capacidad de generalización en simulaciones de bucle cerrado. Los resultados indican que STR2 logra mantener una precisión consistente a medida que incrementa tanto el tamaño del modelo como la cantidad de datos.
Al ofrecer un núcleo de expertos múltiples basado en MoE, el STR2 establece un nuevo estándar al mostrar mejoras en precisión de trayectorias y flexibilidad al balancear recompensas contradictorias, como avanzar en la ruta planeada y evitar colisiones de manera simultánea.
Los desafíos en los escenarios de prueba han sido elevados: se pone a prueba la capacidad de los modelos para adaptarse a situaciones no vistas previamente, como sitios de accidentes simulados, lo cual estrena un nuevo nivel de rigor para calibrar las habilidades de planeación autónoma. Este esfuerzo por mejorar la escalabilidad sin comprometer la eficiencia es fundamental para avanzar hacia la aplicación práctica de la conducción autónoma en situaciones reales y complejas.
Con aportes significativos a la arquitectura y metodología, este estudio refuerza la noción de que los sistemas de aprendizaje basados en modelos grandes y diversos no solo son viables, sino necesarios para abordar y generalizar en condiciones de conducción autónoma en escenarios tanto comunes como infrecuentes. Este trabajo competitivo desafía concepciones anteriores y señala un camino hacia vehículos autónomos más seguros y precisos en su toma de decisiones, al priorizar un balance adecuado entre eficiencia y seguridad en situaciones dinámicas reales.