Latam-GPT、8TB超で学習する地域LLM：企業・公的機関に無償提供へ

チリは2026年2月10日、Centro Nacional de Inteligencia Artificial（CENIA）が開発したオープンソースAIモデル「Latam-GPT」を公開する。8TB超のデータで学習し、開発費はUS$550,000で、資金はDevelopment Bank of Latin America（CAF）とCENIAによる。

初版はAmazon Web Servicesのクラウドで開発され、将来はUniversity of Tarapacáのスーパーコンピューターで学習予定で、企業と公的機関に無償提供する。

From: Latam-GPT: a Latin American AI to combat US-centric bias

【編集部解説】

Latam-GPTの論点は「新しいチャット体験」よりも、ラテンアメリカの言語・文化に寄せたアプリケーションを作るための“基盤となるモデル”を、オープンソースとして整備する点にあります。

大規模言語モデルは、学習データの構成比がそのまま出力の傾向に影響しやすく、地域データが少ないとステレオタイプが混ざりやすい、という問題意識が記事内で示されています。オープンモデルであることは、用途ごとに“直したいところを直す”余地を作ります。

企業・公的機関への無償提供や、病院の物流・医療資源の利用といった例が挙げられており、現場実装を強く意識した設計だと読み取れます。

一方で、チリ大学のアレハンドロ・バロスは「主要モデルと競争する見込みはない」と述べており、狙いは“世界一の汎用モデル”ではなく“地域特化の実用性”に置かれています。

また、地域内で開発・運用の経験を積むことは、AIの安全基準や公共利用のルールづくりを「使う側」だけの議論にしないための下地にもなります。

ただし、オープンであるほど悪用耐性や運用ガバナンスが重要になり、「偏りを減らす」狙いが別の偏りを生む可能性もあります。

【用語解説】

オープンソース（オープンモデル）
プログラマーが用途に合わせ、モデルやソフトの一部をカスタマイズできる形のモデルを指す。

クローズドな生成モデル
ChatGPTやGoogleのGeminiのように、提供側の枠組みの中で利用することが前提の生成AIを指す。

学習データ（トレーニングデータ）
モデルが言語の傾向を学ぶために使うデータで、地域データの比率が小さいと出力の偏りに影響する。

バイアス（偏り）／ステレオタイプ
特定地域が画一的に描写される問題を指し、Latam-GPTはその是正を目的の一つに据える。

スラング／慣用句
地域特有の言い回しで、カスタマーサービス用途などで理解できることが価値になる要素だ。

【参考リンク】

CENIA（Centro Nacional de Inteligencia Artificial）（外部）
Latam-GPTを開発したCENIAの公式サイト。研究活動や発表情報を確認できる。

Latam-GPT（外部）
Latam-GPTの公式Webサイト。プロジェクト概要や関連情報への導線がまとまる。

【参考動画】

【参考記事】

AP News：Chile launches open-source AI model designed for Latin America（外部）
チリ発のLatam-GPTを、地域向けオープンソースAIモデルとして報じる。

Reuters：Latin American countries to launch own AI model in September（外部）
ラテンアメリカ諸国が独自AIモデル開発に動く流れを伝え、背景を補う。

WIRED：Latam-GPT: Meet the Open Source AI of Latin America（外部）
Latam-GPTを協働型オープンソースの地域AIとして紹介し、文脈を解説する。

CENIA：Latam-GPT公式発表（スペイン語）（外部）
CENIAによる公式記事。Latam-GPTの位置づけや関係機関の説明が読める。

【編集部後記】

Latam-GPTの話は、AIの“性能競争”よりも「どの文化や言葉がAIに映るのか」という問いに近い気がしています。もしみなさんの現場で、方言・業界用語・価値観のズレが原因でAIの回答に違和感が出た経験があれば、どんな場面だったか教えてください。