Un nuevo estudio llevado a cabo por un equipo internacional de expertos en inteligencia artificial (IA) señala la urgencia de desarrollar sistemas de IA verdaderamente inclusivos. El objetivo es que estos estén diseñados no solo para todos, sino con la participación de usuarios diversos de todo el mundo, y construidos por una comunidad global de desarrolladores.
Los investigadores han expuesto que los modelos actuales de IA, que incluyen desde grandes modelos de lenguaje (LLMs) hasta modelos multimodales, representan únicamente una visión limitada del mundo, enfocándose mayormente en poblaciones occidentales, educadas e industrializadas. Este enfoque, conocido como representación WEIRD, crea una imagen homogénea que borra ricas tradiciones culturales y fuentes de conocimiento.
Está cada vez más claro que esta falta de diversidad tiene profundas implicancias. Primero, limita la capacidad de estas tecnologías para funcionar eficazmente en contextos variados y para servir a grupos diversos. Segundo, puede conducir a errores, conceptos erróneos e incluso daños, especialmente en aplicaciones que dependen de estas IA.
Para contrarrestar este sesgo implícito y explícito, se propone un rediseño del modelo de desarrollo de IA integralmente inclusivo. Esto involucra un enfoque en la creación de datos verdaderamente representativos de la diversidad del mundo, la inclusión de una amplia variedad de anotadores culturales, y la participación de desarrolladores de sistemas de todo tipo de orígenes y geografías.
Uno de los problemas destacados es la falta de diversidad en las fuentes de datos utilizadas para entrenar estos modelos. Los grandes conjuntos de datos actuales suelen extraerse mayoritariamente de internet, lo que excluye a un 37% de la población mundial que no tiene acceso o cuya cultura rara vez está representada en línea. Este sesgo también afecta a las culturas que no tienen una presencia robusta en internet.
Asimismo, las normas de anotación de datos no suelen ser inclusivas, basándose en su mayoría en convenciones occidentales que no reflejan la subjetividad inherente y la diversidad de datos global. Según investigaciones recientes, la ausencia de estándares inclusivos conduce a la creación de modelos que no se adaptan bien a tareas del mundo real y con frecuencia producen resultados sesgados.
Para mitigar estos problemas, los expertos proponen una serie de medidas, entre las que destacan la colaboración con expertos culturales o antropólogos durante la recolección y anotación de datos, así como el uso de estrategias innovadoras que tengan en cuenta la pluralidad cultural del mundo.
Finalmente, el estudio concluye que para avanzar hacia un futuro donde la IA sirva a todos por igual, se deben romper los patrones tradicionales de concentración económica en áreas ricas y culturas dominantes. Este cambio requerirá una acción coordinada, que incluya desde políticas gubernamentales más inclusivas hasta incentivos para las empresas tecnológicas y mayor apoyo a iniciativas filantrópicas que promuevan desarrollos de IA centrados en la equidad y la representación verdadera de todas las comunidades del mundo.