Investigadores de la Universidad Tsinghua y otros centros presentaron el novedoso método MENTOR, diseñado para optimizar el aprendizaje con refuerzo profundo en tareas visuales complejas mediante la incorporación de la arquitectura Mixture-of-Experts (MoE). Este sistema no solo revuelve las contradicciones de gradiente características de los métodos convencionales, sino que también introduce un mecanismo de perturbación orientado a la tarea que optimiza las trayectorias de aprendizaje en entornos robóticos reales.
MENTOR cambia el enfoque tradicional de redes neuronales perceptron multicapa por un sistema modular, donde los agentes de aprendizaje eligen expertos especializados para evitar conflictos de gradientes. Este enfoque ha permitido a MENTOR superar modelos convencionales en simulaciones tan desafiantes como el conjunto de control DeepMind, Meta-World y Adroit, demostrando una eficiencia de éxito promedio del 83% en tareas reales complejas. Los experimentos realizados con manipulaciones robóticas muestra que se alcanzan niveles inéditos de éxito frente al 32% logrado por algoritmos visuales de aprendizaje sin modelo.
El nuevo mecanismo de perturbación agrega dinamismo en la exploración eficaz de las capacidades del agente al implementar una distribución de prueba basada en los agentes de mejor rendimiento. En pruebas exitosas con tareas como inserción de clavijas, disposición de cables y mini-golf en mesa, el éxito del sistema MENTOR radicó en su capacidad para sortear los desafíos de entorno de la robótica real. Este avance subraya la importancia de la eficiencia de muestras para progresar en el campo del aprendizaje visual con refuerzo.
Los resultados globales sugieren que MENTOR no solo supera las limitaciones típicas de baja eficacia de muestras, sino que también exhibe potencial real para aplicaciones prácticas de robótica en el mundo físico. Más que una simple teoría, MENTOR traduce estas mejoras en efectividad tangible, ofreciendo una guía alentadora para futuras investigaciones robóticas visuales.