Un reciente estudio llevado a cabo por Xiannan Huang y su equipo, enfocado en la precisión del tráfico a corto plazo, ha revelado la importancia de los datos históricos extensos en la formación de modelos predictivos de tráfico más precisos. Comúnmente, las investigaciones en este ámbito habían priorizado la refinería de arquitecturas de modelos, dejando en segundo plano el volumen de los datos de formación. Sin embargo, este nuevo enfoque ha demostrado que la incorporación de datos históricos de gran escala puede, sorprendentemente, a veces disminuir la precisión debido a las discrepancias entre los patrones de tráfico del pasado y del presente en lugares como Nueva York.
Utilizando dos conjuntos de datos que abarcan el uso de taxis y bicicletas durante más de ocho años, el equipo realizó experimentos para evaluar la precisión de varios modelos, al ser entrenados con datos de diferentes duraciones, entre 12 y 96 meses. Se descubrió que el entrenamiento con datos que abarcan períodos más extensos no conducía siempre a una mayor precisión de predicción. Particularmente, cuando se incluían datos de 96 meses, en ciertos casos, el resultado era una precisión disminuida.
Un análisis profundo sobre este fenómeno demostró que tanto los cambios conceptuales como una modificación en los covariantes influyen en estos patrones inconsistentes. Para contrarrestar estas incongruencias, el equipo presentó un método innovador que alinea las distribuciones de covariables mediante un enfoque de ponderación, junto a un método de aprendizaje sensible al entorno para abordar los cambios conceptuales.
Los experimentos basados en datos reales han demostrado la efectividad de este método, disminuyendo significativamente los errores en las pruebas y asegurando una mejora en la precisión cuando se entrena con la extensa data histórica acumulada. Esta investigación es el primer intento de evaluar el impacto de expandir continuamente el conjunto de datos de entrenamiento en la precisión de los modelos de predicción de tráfico.
Aunque el volumen de datos históricos introduce un reto significativo en términos de discrepancias de patrones, esta investigación señala que con un manejo adecuado de la variabilidad de estos datos es posible mejorar la exactitud en las predicciones y con ello, optimizar el flujo vehicular en grandes ciudades. Además, destaca la necesidad del uso de métodos específicos y divergentes para la alineación de datos, en lugar de enfoques generalizados que no aborden las características particulares del tráfico urbano.
En conclusión, al abordar simultáneamente los cambios en los covariantes y los conceptos, los modelos de predicción de tráfico obtienen beneficios significativos de los datos históricos de gran escala, ofreciendo una herramienta poderosa para la gestión y reducción de la congestión urbana.