Nace el primer LLM entrenado para América Latina

Latam-GPT: el primer gran modelo de lenguaje entrenado en América Latina. Una entrevista exclusiva con Rodrigo Durán (CENIA) revela cómo busca darle voz digital propia a la región

En medio del caos del metro de Santiago de Chile, a solo semanas del lanzamiento de su versión beta, Rodrigo Durán, director ejecutivo de CENIA, habla con la convicción de quien está empujando algo más grande que un producto tecnológico. “La meta de Latam-GPT es alcanzar la soberanía tecnológica, construir un modelo de lenguaje que represente el mundo desde la visión e idiosincrasia de Latinoamérica y el Caribe”, asegura al conversar con Alejandro Mancilla, EiC @ Interesante.

“La meta es alcanzar la soberanía tecnológica, construir un modelo de lenguaje que represente el modelo del mundo desde la visión e idiosincrasia  de Latinoamérica y el Caribe”, cuenta Durán. Foto: Cortesía CENIA.

Latam-GPT no es un proyecto cualquiera. Es el primer modelo de lenguaje a gran escala (LLM) creado de manera colaborativa en América Latina, con el respaldo de instituciones científicas, universidades y empresas tecnológicas. Su promesa: que la inteligencia artificial deje de hablar con acento ajeno y empiece a reflejar de manera precisa las realidades culturales y lingüísticas de la región, como reportó El País.


En una entrevista exclusiva de Interesante con Alejandro Mancilla, Rodrigo Durán revela el nacimiento de Latam-GPT. Tres futuros hacia 2026 —éxito, fracaso o símbolo— y su lugar en la carrera global frente a EE.UU., Europa, India y China.

Un sueño bolivariano convertido en código IA

La idea inicial fue bautizar el proyecto como BOLÍVAR, en honor al libertador que soñaba con unir América Latina bajo una misma causa. Aunque el nombre final cambió a Latam-GPT, el espíritu se mantuvo: traducir ese sueño de independencia en el terreno de la inteligencia artificial.

Desde la música de Los Prisioneros en los años 80, con su “Latinoamérica es un pueblo al sur de Estados Unidos”, hasta los acordes de Café Tacvba en los 90 cantando “seremos capaces de bailar por nuestra cuenta”, la región ha buscado emancipación cultural. Hoy, esa independencia se juega en los datos y los algoritmos––pero más allá de todo lo tecnológico, luchamos por la codificación y certificación de la cultura Latinoamericana en la inteligencia artificial global. Pues, como con otros avances, los países con más recursos son los que escriben la historia global, desde la Biblia Judia hasta La Constitución de los Estados Unidos.


Las instituciones aliadas que crearon a Latam-GPT

Latam-GPT comenzó como un proyecto “muy chileno”, pero pronto sus límites fueron evidentes. “Vimos que si queríamos allanar recursos, teníamos que hacerlo en una escala mayor”, reconoce Durán. El Data Observatory y CENIA fueron los impulsores iniciales, pero el músculo regional vino con aliados:

  • Brasil, a través de la Universidad de São Paulo, clave porque “la mitad de América Latina es literalmente Brasil”, dice Durán.
  • México, con el Tecnológico de Monterrey.
  • Uruguay, con la Universidad de la República.
  • Ecuador, con la Universidad Espíritu Santo.
  • Además de instituciones en Perú y Costa Rica.
«El primer anuncio de que se estaba desarrollando Latam-GPT se da en el contexto de la Cumbre de Inteligencia Artificial Responsable en Cartagena de India, pero fue después de la Cumbre de París que se dio a conocer públicamente». En la imágen, Rodrigo Durán. Foto: Cortesía CENIA.

La colaboración con Amazon Web Services, que aportó 2 millones de dólares en créditos de nube, permitió destrabar uno de los problemas más críticos: el cómputo, como destacó Reuters. Es un esfuerzo de varias instituciones de América Latina. Poco a poco se fueron sumando y el proyecto comenzó a tener certezas, señala Durán.


El reto técnico: datos, cómputo y legitimidad

Latam-GPT nació con tres desafíos inmediatos. El primero fue la escasez de datos locales de calidad para entrenar un modelo de esta escala. El segundo, la reticencia de titulares de derechos a compartir obras para entrenamiento. El tercero, la falta de capacidad de cómputo en Chile.

Por decirlo de alguna forma, a la escala que nosotros lo queríamos hacer —70 mil millones de parámetros— no teníamos la capacidad, admite Durán. A diferencia de los gigantes como OpenAI, que recurren a scrapeo masivo de internet, Latam-GPT se propuso un camino distinto. Establecimos acuerdos estrictos de utilización de datos que garantizan que se usarán solo con autorización del titular. Latam-GPT se trata de un modelo ético, explica Durán.

El trabajo del equipo en el CENIA es contrarreloj. Foto: Cortesía de CENIA

Ese enfoque no solo marca distancia técnica, sino política: transparencia y respeto a los derechos, en una época donde la explotación indiscriminada de datos ya ha levantado debates éticos. Rest of World señaló justamente que la falta de infraestructura y la complejidad de los acuerdos de datos son los mayores obstáculos que enfrenta el proyecto.


ADN abierto e inclusivo

Uno de los pilares del proyecto es su vocación open source. “El dataset y los parámetros van a estar abiertos para los usuarios que quieran construir otras cosas”, asegura Durán. Eso significa que startups, gobiernos y universidades podrán usar Latam-GPT como base para construir aplicaciones adaptadas a sus necesidades.

La inclusividad no se limita a liberar el código. El reto es lingüístico y cultural. “El guaraní es la lengua oficial de Paraguay junto con el español; en Perú, más de un 15% de la población habla aymara. Ese tipo de inclusión es un desafío mayúsculo”, reflexiona Durán.

«Establecimos acuerdos estrictos de utilización de datos que garantizan de que estos se usarán para aquello que el titular intelectual permitió originalmente”, asevera Rodrigo Durán. Foto: Cortesía de CENIA.

El modelo busca integrar lenguas indígenas como mapudungún, guaraní o rapanui, además del español y portugués. La diferencia, explica, está en la visión del mundo: los datos no solo transmiten palabras, sino formas de pensar y vivir que no aparecen en modelos entrenados en inglés.


Preservación cultural en la era de la IA

Latam-GPT también se plantea como un mecanismo de preservación cultural. En un contexto donde las nuevas generaciones consultan más con ChatGPT que con Google, el riesgo es que el conocimiento latinoamericano quede fuera de los modelos globales.

“Es ahí donde va a estar el conocimiento; hay un interés no solo de los Estados, sino también de organizaciones de la sociedad civil para que el conocimiento que ellas han desarrollado esté presente en estas nuevas plataformas”, asevera Durán.

Como recordó The World, el plan no es solo cultural: se trabaja también en migrar parte del cómputo a un centro de datos solar en el desierto de Atacama, buscando independencia energética y reducir la huella ambiental del entrenamiento.


Lo que viene

Durán no oculta el reto económico: “Sostener 24/7 un modelo así es sumamente costoso”. Pero sueña en grande: para 2026, Latam-GPT 1.0 podría ser multimodal, capaz de procesar texto, video y audio. Por ahora, la beta se lanzará en septiembre de 2025. Será limitada, sin interfaz de chat aún, pero marcará el inicio de algo mayor: el primer modelo de lenguaje entrenado desde y para América Latina y el Caribe.

“El data set y  los parámetros, van a estar abiertos para los usuarios que quieran construir otras cosas”, asegura al respecto nuestro entrevistado. Foto: Cortesía: CENIA

La pregunta queda abierta: ¿será Latam-GPT un simple gesto simbólico o el punto de partida de una nueva soberanía tecnológica en la región?