Investigadores de la Universidad Kwansei Gakuin han desarrollado un novedoso método llamado DeepGAT, dirigido a mejorar el rendimiento de las redes neuronales gráficas, conocidas como GNNs. Estas redes son esenciales para representar información, como estructura de redes sociales y moléculas, en forma de grafos. Sin embargo, el problema del “sobre-suavizado” afecta su eficacia a medida que aumenta el número de capas, un fenómeno donde la representación de los nodos se vuelve uniformemente similar y deteriora el rendimiento de estas redes.
DeepGAT es una solución innovadora que permite la construcción de una red de atención gráfica (GAT) de 15 capas con un rendimiento simulado similar a una GAT de solo 2 capas. A diferencia de las estrategias convencionales que requieren ajustar manualmente el número de capas, DeepGAT hace esto automáticamente, evitando la problemática del sobre-suavizado al asegurar, a cada nivel, que no se borre la distinción entre diferentes clases de nodos.
La técnica utiliza el llamado ‘coeficiente de atención’ para mejorar el enfoque desigual en la convolución de las características de los nodos, garantizando que las características de los nodos pertenecientes a distintas clases permanezcan diferenciables. Esto se traduce en niveles de atención más parecidos a redes de pocas capas, permitiendo que las representaciones sean precisas y se retengan diferencias clave entre distintas clases.
Los resultados experimentales han demostrado el éxito de DeepGAT al aplicar la metodología en varios conjuntos de datos complejos donde otras redes GNN fallaron debido al sobre-suavizado. DeepGAT facilita así el entrenamiento de grandes redes que pueden adquirir coeficientes de atención similares a redes más compactas, ahorrando tiempo y optimizando la eficiencia sin necesidad de ajuste minucioso de las capas.
En conclusión, DeepGAT representa un avance significativo en el procesamiento de datos basados en grafos, asegurando una diferenciación clara entre nodos mediante atención centrada flexible en múltiples capas, estableciendo así un nuevo estándar en el contexto de redes neuronales gráficas sin la problemática del sobre-suavizado.