El Ministerio de Ciencia, Tecnología, Conocimiento e Innovación (CTCI) y el Centro Nacional de Inteligencia Synthetic (Cenia) de Chile han anunciado la creación de Latam GPT. Este modelo de lenguaje grande (LLM, por sus siglas en inglés), basado en inteligencia synthetic (IA), busca representar con precisión la historia y cultura de Latinoamérica.
El algoritmo ha estado en desarrollo desde 2023 y su lanzamiento oficial está previsto para junio de este año. Es capaz de procesar 55 billones de parámetros y cuenta con tres trillones de datos en tokens. Su capacidad es equiparable a la de ChatGPT 3.5 de OpenAI. Latam GPT se concibe como un modelo público, inclusivo y abierto, con licencias para la creación de aplicaciones personalizadas basadas en su arquitectura informática.
El proyecto cuenta con el respaldo de expertos, organizaciones y centros de investigación de México, Argentina, Colombia, Ecuador, Estados Unidos, España, Perú y Uruguay. Entre las instituciones mexicanas participantes destacan el Centro de Investigación en Ciencias de Información Geoespacial, el Instituto Nacional de Astrofísica, Óptica y Electrónica y el Centro de Investigación e Innovación en Tecnologías de la Información y Comunicación.
“Los LLMs se están integrando rápidamente en nuestra vida diaria. Pero, ¿qué sucede cuando formulamos preguntas sobre Latinoamérica? Aunque los modelos actuales son de alta calidad, su comprensión del contexto latinoamericano puede mejorarse. Por ello, creemos imprescindible desarrollar un modelo regional que refleje de manera precisa nuestra historia y cultura”, señala el sitio net del modelo.
Latam GPT fue presentado en la Cumbre para la Acción sobre la IA de París. Aisén Etcheverry, titular del CTCI, destacó que el desarrollo de este modelo es estratégico y busca proyectar el liderazgo de Chile y el resto de la región en el sector de la inteligencia synthetic. Aseguró que se trata de un paso hacia la democratización del acceso a esta tecnología. “Todos los países deben tener la posibilidad de desarrollar sistemas de IA, implementarlos en sus gobiernos y aplicarlos en sus industrias. Las capacidades para lograrlo no pueden estar concentradas en unas pocas empresas o naciones”, subrayó.
Por su parte Rodrigo Durán, gerente basic del Cenia, indicó que el objetivo principal es ofrecer un algoritmo abierto y accesible que fomente la investigación y el desarrollo de la IA en Latinoamérica. “El espíritu del modelo es que sea el mejor para resolver problemas específicos de América Latina y el Caribe”, enfatizó.
Latam GPT continúa su proceso de entrenamiento. La página net del proyecto sugiere que el público en basic puede participar en esta fase. Los interesados deben solicitar una clave de acceso según su país de origen o el que deseen representar, mediante un correo electrónico. La plataforma admite entradas de texto en español y abarca temas generales relacionados con Latinoamérica, como las diferencias semánticas y dialectales entre naciones, hechos históricos, referencias geográficas y políticas, así como cuestiones medioambientales y culturales. “No es necesario que todas las preguntas sean formales o con ortografía perfecta. Ambos tipos de escritura se valoran y se emplean para optimizar el sistema”, señala el portal.
El Cenia ha destinado aproximadamente 550,000 dólares en el desarrollo de Latam GPT, con casi la mitad de los fondos aportados por la Corporación Andina de Fomento. Además, la Universidad de Tarapacá ha invertido 5 millones de dólares en la instalación de una supercomputadora que ha acelerado el entrenamiento del modelo.