El Gobierno de España ha anunciado el lanzamiento oficial de Alia, una familia de modelos fundacionales de inteligencia synthetic (IA) desarrollada por el Estado y entrenada directamente en español y otras lenguas cooficiales. Este proyecto busca las brechas lingüísticas en la industria de la IA.
Alia ha sido capacitada en castellano, catalán, gallego, valenciano y vasco. Es una herramienta de código abierto y ya está disponible en la página Alia.gob.es, lo que facilita su uso por cualquier entidad pública o privada para desarrollar soluciones de IA personalizadas. Pedro Sánchez, presidente de España, ha adelantado que la Agencia Tributaria diseñará un chatbot interno basado en esta nueva tecnología y habilitado para agilizar las gestiones y procesos fiscales. Por su parte, el Ministerio de Sanidad desarrollará una aplicación para optimizar el diagnóstico temprano de insuficiencias cardíacas en la atención primaria.
La nueva familia de IA fue anunciada por primera vez en la edición pasada del Cell World Congress (MWC 2024). Sánchez señaló en aquel momento que el proyecto sería resultado de una colaboración público-privada con el Barcelona Supercomputing Heart, la Crimson Española de Supercomputación, la Academia Española de la Lengua y la Asociación de Academias de la Lengua Española.
La inversión pública para la iniciativa está considerada en la Estrategia de Inteligencia Synthetic 2024, publicada el año pasado. El plan gubernamental asigna 10 millones de euros al desarrollo de modelos propios de IA y prevé ampliar el conjunto de datos lingüísticos de los algoritmos a un mínimo de cuatro billones de palabras. Alia continúa alimentándose con una amplia gama de documentos oficiales, incluidos los diarios de las sesiones parlamentarias, y una extensa colección de repositorios científicos.
La meta es que “España juegue un papel relevante a nivel europeo e internacional en el desarrollo de la inteligencia synthetic y proporcionar una infraestructura abierta, pública y accesible para las empresas, de forma que puedan disponer de un modelo de lenguaje de gran escala que favorezca el desarrollo de aplicaciones avanzadas para su posterior explotación económica”, sostuvo Sánchez en el MWC 2024.
Las ambiciones de España en el sector de la IA
La Estrategia de Inteligencia Synthetic 2024 cuenta con un presupuesto whole de 1,500 millones de euros, a los que se suman otros 600 millones ya asignados a través de la Estrategia Nacional de Inteligencia Synthetic (ENIA) de 2020. El jefe de Gobierno federal ha anunciado que se destinarán 150 millones adicionales para fomentar el uso de la IA en las empresas. Los recursos se enfocarán en el desarrollo de nuevos modelos de lenguaje de última generación, el fortalecimiento de la infraestructura estatal de supercomputación y la formación de talento especializado.
El presidente español asegura que “la IA puede ser una herramienta decisiva para el progreso social” y tiene potencial para “combatir la desigualdad de oportunidades e ingresos”. Pese a ello, para capitalizar las oportunidades es necesario crear modelos inteligentes adaptados desde su origen a idiomas más allá del inglés.
Elena González-Blanco, cofundadora de Clibrain y jefa de inteligencia synthetic de Microsoft para Europa, Oriente Próximo y África asegura que “nos encontramos en un mundo en el que los modelos de inteligencia synthetic generativa han nacido y han sido entrenados en inglés. Simplemente, se han traducido a distintas lenguas. A pesar del gran volumen de hispanohablantes que hay en el globo, son pocas las tecnologías que están centradas en nuestro idioma“.
El fenómeno es llamativo si se considera el amplio mercado que se encuentra desatendido. Cálculos del Instituto Cervantes puntualizan que en el mundo existen 500 millones de hispanohablantes. El español es el tercer idioma más utilizado en web, solo por detrás del inglés y el chino. Las personas que lo hablan tienen la capacidad de generar ganancias cercanas al 10% del Producto Interno Bruto (PIB) mundial.