Rio 3.5 Open 397B登場——ブラジル自治体製AIが世界最上位に？「マージ＋蒸留」を認めた経緯を読み解く

ブラジル・リオデジャネイロ市政府傘下のIT企業IplanRIOが、AIモデル「Rio 3.5 Open 397B」をHugging FaceにMITライセンスで公開した。2026年6月14日にMetaEraが報じた。総パラメータ数は通称3,970億、アクティブ化パラメータ数170億のMoEアーキテクチャを採用する。

当初はAlibabaのQwen 3.5を土台に事後学習した独自モデルと説明され、約100万トークンの拡張コンテキストやSwiReasoning対応をうたい、エージェント・プログラミングや数学などのベンチマークでオープンソースモデル中最高水準を達成したとして話題を呼んだ。しかし公開直後、別チームNex-AGIが「独自学習ではなく自社モデルNexとQwenのマージだ」とGitHubで告発。Rio側もモデルカードで、本来のモデルは「Nex-N2-ProとQwen3.5-397Bのマージにオンポリシー蒸留を施したもの」であり、以前の版で誤ったアップロードがあったと認め謝罪した。Hugging FaceのCEOクレム・ドゥラングが反応したことでも注目を集めた。

From: Rio 3.5 Open 397B, a Brazilian municipal AI model, enters the global AI top tier.

【編集部解説】

ブラジルの一地方自治体が、世界最先端クラスのAIモデルを公開した——この見出しだけを読むと、技術勢力図が塗り替わる痛快なニュースに思えます。しかし、innovaTopiaが「未来を報じるメディア」として今この記事を扱う理由は、痛快さの裏にある二つの問い、すなわち「AIは誰のものになるのか」と「私たちは性能の主張をどう検証すべきか」を、読者と一緒に考えたいからです。

まず事実関係を整理します。Rio 3.5 Open 397Bは、リオデジャネイロ市の自治体IT企業IplanRIO名義で、Hugging FaceにMITライセンスで公開されたモデルです。当初は「AlibabaのQwen 3.5を土台に事後学習した独自モデル」と説明されていましたが、後述の経緯を経て、現在は別の説明に書き換わっています。構造はMixture of Experts(MoE)、すなわち総パラメータ3,970億のうち実際の計算では170億分しか起動しない「省エネ型」です。なお、ファイル上のメタデータでは総数が約4,034億パラメータとの確認もあり、「3,970億級」は通称と捉えるのが正確です。

ここで起きた一連の出来事こそが、このニュースの核心です。

公開直後、Nex-AGIという別チームがGitHub上で「Rioは独自学習されたものではない」と告発しました。彼らの主張によれば、Rioの重みは自分たちのモデル「Nex」とQwen基盤モデルを約6対4で機械的に混ぜ合わせただけのもので、独自学習の痕跡が見当たらない。証拠として、Rio側が組み込んだ「あなたはRioです」という指示を外すと、モデルが79%の確率で自らを「Nex-AGIのNex」だと名乗り、Nex側の組織説明を一字一句そのまま暗唱した、と報告しています。

そして注目すべきは、Rio側がこの指摘を事実上認めたことです。現在のモデルカードには、「以前のバージョンで、最終的な蒸留モデルではなく“マージしただけの版”を誤ってアップロードしてしまった」という謝罪が追記されています。Rio自身の説明によれば、本来のモデルは「Nex-N2-ProとQwen3.5-397Bをマージし、その上でより強力なモデルからのオンポリシー蒸留(On-Policy Distillation)を施したもの」であり、Nex-N2-Proはモデルカード上できちんとクレジットしている、とのことです。つまり「ゼロから自治体が作った独自モデル」という当初の物語は、本人たちの説明によって大きく後退したのが現状です。なお、当初うたわれていたSwiReasoning対応については、現行のモデルカードからは説明が削られており、実装や評価条件は確認できていません。

性能主張についても慎重さが要ります。AI解析メディアのKingy AIは、公開されたベンチマーク数値(例えばコーディング指標Terminal-Bench 2.1で70.8、ベースのQwen3.5は52.5)がすべて「モデルカードの自己申告のみ」で、第三者による再現が存在しないと整理しています。少なくとも公開済みの比較表を見る限り、Rioがベースのモデルに対して全項目で勝っているわけではありません。知識指標のMMLU-Redux、マルチモーダルのMMMU-ProやVideoMMMUなど、複数の項目ではむしろ下回っています。さらに、約100万トークンと謳うコンテキスト長も、設定ファイル上の実体は262,144トークンで、100万トークン級の利用にはRoPE/YaRNなどの拡張設定やserving時の調整が必要とみられる、と同メディアは注意を促しています。

それでも、このニュースが照らし出す論点には大きな価値があります。元記事でHugging FaceのCEOクレム・ドゥラングが「シリコンバレーとワシントンの少数が未来を決める道か、誰もが参加できるオープンAIの道か」と問いかけたように、AI開発の主体が巨大テック企業から、公共機関や中小組織へと拡散しうる可能性そのものは本物です。たとえRioの事例に誇張や混乱があったとしても、「公開された土台の上に誰でも乗れる」というオープンウェイトの構造的な意味は変わりません。

そして、今回の一件で最も希望が持てるのは、誤りが短時間で明るみに出て、本人が訂正に追い込まれたこと自体かもしれません。重みが公開されていたからこそ、Nex-AGIは重みの数学的比較という検証可能な根拠を突きつけることができました。これはクローズドなAPIモデルでは決して起こらない、オープンソースならではの自浄作用です。一方でリスクも併存します。MITライセンスでの公開は自由な改変・商用利用を許す反面、安全対策の制御が効きにくく、約807GBという容量は結局、高性能GPUを多数並べられる組織しか自力運用できない現実も突きつけます。「民主化」と「ハードルの高さ」は同居しているのです。

長期的に見れば、今回の騒動は「ベンチマーク至上主義」への警鐘でもあります。SNSで数字が一人歩きし、検証を経ないまま「SOTA(最高性能)」の称号が飛び交う——その危うさと、それでも数日で訂正へ至る検証文化の健全さ。その両方を、Rio 3.5の事例は鮮やかに示しました。未来を知りたい私たちにとって本当に必要なのは、華やかな数字そのものではなく、その数字が再現可能かどうかを問い続ける姿勢なのだと思います。

【用語解説】

Rio 3.5 Open 397B
リオデジャネイロ市の自治体IT企業IplanRIO名義で公開された大規模AIモデル。当初は独自学習と説明されたが、後にRio側が「Nex-N2-ProとQwenのマージにオンポリシー蒸留を施したもの」と訂正し、誤アップロードを謝罪した。総パラメータ3,970億級・起動170億のMoE構造を持つ。

ポストトレーニング（事後学習）
すでに大量のデータで訓練済みの「基盤モデル」に対し、追加で学習を施して特定の能力や振る舞いを引き上げる工程。ゼロから巨大モデルを作るより低コストで、性能を底上げできる手法として広く使われている。

マージ（モデルマージ）
複数のモデルの重み(パラメータ)を数値的に混ぜ合わせ、一つのモデルを作る手法。新たな学習を伴わずに既存モデルの性質を組み合わせられる。Rioの当初版は、NexとQwenを約6対4で混ぜたものだと指摘された。

オンポリシー蒸留（On-Policy Distillation）
より強力な「教師モデル」の出力を手本に、別のモデルへその能力を移す「蒸留」の一種。Rio側はこの工程を最終モデルに施したと説明しているが、具体的な手順・教師モデル・使用データは公開されていない。

Mixture of Experts（MoE）
モデル内部に多数の「専門家(エキスパート)」サブネットワークを抱え、入力ごとに一部だけを起動する構造。総パラメータは巨大でも、1回あたりの計算量を抑えられる。Rioの場合、総数3,970億級のうち実際に動くのは170億にとどまる。

アクティブ化パラメータ
MoEモデルが1トークンの処理に実際に使うパラメータ数。記憶容量を左右する総パラメータとは別物で、「170億アクティブ」でも全体の重みは保持が必要なため、運用が軽いとは限らない点に注意が要る。

コンテキストウィンドウ
AIが一度に読み込み・参照できる情報量の上限。Rioは約100万トークンを掲げるが、設定ファイル上の実体は262,144トークンで、100万トークン級の利用には拡張設定や運用時の調整が必要とみられる。

SwiReasoning
シー(Shi)らの2025年の研究に基づく、追加学習不要の推論フレームワーク。確信度のシグナルに応じて、思考を言葉で書き出す「明示的推論」と、内部で済ませる「潜在空間推論」を自動で切り替え、精度とトークン効率の両立を狙う。Rioは当初これに対応するとうたっていたが、現行のモデルカードからは記述が削られている。

潜在空間推論（latent-space reasoning）
思考過程を自然言語のトークンとして出力せず、モデル内部の連続的な数値表現のまま進める推論方式。計算効率は高い一方、外から検証しづらく、一部の推論エンジンでは実行できないという制約がある。

MITライセンス
非常に制約の緩いオープンソースライセンス。著作権表示さえ残せば、商用・改変・再配布が自由に認められる。一方で、配布物に安全上の歯止めをかけにくい性質も併せ持つ。なお、依存元モデルや個別ファイルを含むライセンスの確認は、商用利用前に別途必要となる。

SOTA（State of the Art）
「最高水準」を意味する語。ベンチマークで既存モデルを上回った際に使われるが、測定条件の統一や第三者再現を伴わない自己申告のSOTAは、額面どおり受け取れないことも多い。

Nex-N2-Pro 397B / Nex-AGI
同じくQwen3.5を土台に最高水準に達したとされる別モデルおよびその開発チーム。Nex-AGIは公開直後、「Rioは自分たちのモデルNexを流用したもの」とGitHub上で告発した当事者である。

【参考リンク】

Rio 3.5 Open 397B（Hugging Face）（外部）
当該モデルの一次情報源。誤アップロードの謝罪やマージ・蒸留に関するRio側の説明が追記されている。

Hugging Face（外部）
AIモデルやデータセットを共有・公開するオープンソースの中核プラットフォーム。Rio 3.5公開と検証の舞台。

Qwen3.5-397B-A17B（Alibaba 通義）（外部）
Rio 3.5の土台の一つとなったAlibaba製の基盤モデル。Apache-2.0ライセンスで公開されている。

Nex-N2 GitHub Issue #4（告発）（外部）
Nex-AGIが「Rioは独自学習されていない」と技術的証拠を挙げて主張したGitHub Issue。論争の一次情報。

SwiReasoning（arXiv論文）（外部）
Rioが当初採用とうたった推論フレームワークの原論文。明示的推論と潜在空間推論の動的切り替えを解説。

【参考記事】

Rio 3.5 Open 397B 公式モデルカード（謝罪・説明の追記）（外部）
Rio側が誤アップロードを謝罪し、本来はマージ＋オンポリシー蒸留だと明記した一次情報。物語修正の決定的根拠。

Rio-3.5-Open-397B ≈ 0.6 x Nex-N2_pro + 0.4 x Qwen（Nex-AGI／GitHub）（外部）
盗用疑惑を提起した当事者の一次情報。重みはNexとQwenの機械的混合で独自学習の痕跡がないと主張。

Analysis shows Rio de Janeiro’s Rio 3.5 Open 397B model（Digg）（外部）
重みの精査から0.6 Nex＋0.4 Qwenのマージとする分析や、Apache 2.0からMITへの不自然な変更を整理。

Rio 3.5 Open 397B: A Serious Open Model Release, Or A Benchmark Claim In Need Of An Audit?（Kingy AI）（外部）
本件を最も詳細に検証した監査記事。ベンチマーク数値は全て自己申告で第三者再現がないと指摘。

Rio de Janeiro launches AI model rivaling ChatGPT, Claude（NewsBytes）（外部）
肯定的トーンで早期に報じた記事。一部のオープン／クローズドモデルを上回ったとする結果を紹介。

Prefeitura do Rio lança IA própria e supera modelos abertos（Exame）（外部）
ブラジル現地報道。意義を認めつつ「ゼロ訓練ではない」「比較は自社ベンチで外部検証が必要」と慎重に指摘。

Rio 3.5 Open 397B da Prefeitura do Rio de Janeiro（swen.ia.br）（外部）
現地記事。長期的信頼には訓練データや評価方法など技術文書の公開が不可欠と説いている。

【編集部後記】

「自治体が世界最先端のAIを作った」という一報に、私たちも最初は胸が躍りました。けれど少し掘ると、マージや蒸留をめぐる訂正や、よく見れば全勝とは言えない数字という影も見えてきます。それでも、誤りが数日で明るみに出て本人が説明し直す——その素早さ自体が、オープンなAIの健やかさのようにも感じます。

みなさんはこのニュース、どう受け止めましたか。華やかなベンチマークの数字を見たとき、「これは誰が、どんな条件で測ったんだろう」と一度立ち止まってみる。そんな視点を、私たちも一緒に持ち続けていけたらうれしいです。

【編集部解説】

【用語解説】

【参考リンク】

【参考記事】

【編集部後記】

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル