La aplicación de algoritmos de deep learning para la reconstrucción de la energía de flujo de partículas ha significado un avance crucial en la física de partículas de alta energía, especialmente en el contexto de los experimentos del Gran Colisionador de Hadrones (LHC). Un reciente estudio ha comparado diversos modelos de deep learning, como MLPs, CNNs, y U-Nets, incluidas variantes avanzadas con módulos de atención y convoluciones 3D, en su capacidad para mejorar la precisión de la reconstrucción de jets.
La investigación utilizó datos de simulaciones complejas, generando mapas de energía que simulan interacciones de partículas en distintos tipos de detectores, como calorímetros electromagnéticos y hadrónicos. Estos mapas se han representado como imágenes en escala de grises, permitiendo identificar la energía, carga y tipo de partículas.
Los tests iniciales, realizados con datasets Gauss_S1.00_NL0.30_B0.00 y Gauss_S1.00_NL0.30_B0.50, permiten evaluar la capacidad de los modelos para manejar escenarios con o sin deflexión de partículas. Los resultados destacaron que a pesar de las limitaciones de MLP en escenarios complejos, el aumento del rendimiento se observó claramente al incorporar atención y self-attention en modelos CNN y U-Nets, que mostraron una notable capacidad para integrar características locales y globales mientras mantenían una gran estabilidad en las predicciones.
Un análisis más profundo incluyó datasets que simulaban escenarios con jets para observar como los modelos pueden adaptarse a anomalías en los datos de entrenamiento. Aquí, el U-Net con atención mostró una superioridad en la precisión de la posición y energía de los jets, gracias a la capacidad de su arquitectura para captar patrones complejos en el espacio de datos.
El estudio no solo resalta la complejidad de la reconstrucción de jets en ambiente de alta energía, sino también el potencial transformador de las técnicas de deep learning que aprovechan arquitecturas avanzadas con mecanismos de atención y convoluciones a nivel tridimensional. Este enfoque optimiza la representación de datos, mejorando la eficacia, precisión y robustez en entornos complejos.
En un futuro cercano, la investigación se centrará en el aprovechamiento de estas técnicas para entornos simulados de alta complejidad, mejorando aún más las predicciones energéticas y la identificación de partículas mediante el uso de arquitecturas dinámicas y sin sesgos en la conectividad de datos estructurados como nubes de puntos.