AIの「なぜ」を説明する新技術根拠強化デコーディングでLVLMの信頼性を向上

NTT株式会社は2026年6月1日、大規模視覚言語モデル（LVLM）の出力の信頼性を高める推論技術「根拠強化デコーディング」を確立したと発表した。

LVLMが段階的推論（Chain-of-Thought、CoT）を行う際、自ら生成した推論根拠を無視して回答する傾向があるという課題に対し、画像を条件とした確率分布と根拠を条件とした確率分布に分け、両者を掛け合わせて出力する方式をとった。マルチモーダルCoTをKLダイバージェンス制約付きの報酬最大化問題として定式化し、追加学習を必要としないプラグアンドプレイ型の手法として実装した。実験では複数のLVLMで正答率などの推論性能が向上した。本成果は2026年6月3日から7日まで米国・デンバーで開催される国際会議CVPR 2026で発表される。著者は山口真弥、千々和大輝、西田光甫。

From: なぜその結果になったのか？推論根拠を説明できるマルチモーダルXAI技術を確立～人とAI、AIとAIの信頼を強化し、安心できるビジネス意思決定やAIエージェント連携などを実現～ | ニュースリリース | NTT

【編集部解説】

「なぜAIはその答えを出したのか」── この問いは、AIを実務に組み込もうとするすべての現場で、最後の関門として立ちはだかってきました。今回NTTが確立した「根拠強化デコーディング」（英語名:Rationale-Enhanced Decoding）は、その関門に正面から取り組む技術です。なぜ今これを取り上げるのか。それは、AIが「答えを出す段階」から「答えに責任を負う段階」へと移りつつある、まさにその転換点に位置する成果だからです。

まず、今回の発見の核心を平易に言い換えておきます。CoT（思考の連鎖）とは、AIが結論の前に「こう考えたから、こうなる」という理由づけを書き出す手法です。私たちはその理由づけを読んで「なるほど、筋が通っている」と納得します。ところがNTTの実験は、スライド画像に対してスポーツカーという無関係な根拠をわざと与えても、AIが正しい答えをそのまま返してくる場合があることを示しました。つまりAIは、書き出した理由を実は見ておらず、画像だけを頼りに答えを出していた。理由づけは、後から取って付けた「説明風の文章」にすぎなかったわけです。

この「説明と中身の食い違い」は、NTT固有の発見というより、生成AI研究全体が近年突きつけられてきた共通課題でもあります。Anthropicは2025年に、推論モデルが示す思考過程が実際の内部処理を忠実には反映しないと指摘しました。フロンティアモデルを実環境で検証した研究では、不忠実な推論が一定割合で観測され、Claude 3.7 Sonnet（論文表記はSonnet 3.7）で16.3%、DeepSeek R1で5.3%、ChatGPT-4oで7.0%という数値も報告されています。AIの「説明」を鵜呑みにできないことは、もはや業界の共通認識になりつつあるのです。

NTTのアプローチが巧みなのは、AIに「理由をちゃんと見ろ」と命じるのではなく、構造そのものを作り替えた点にあります。画像を見て考える経路と、根拠を読んで考える経路を物理的に分け、最後に重みを付けて掛け合わせる。こうすれば、根拠を無視しようにも無視できない。説教ではなく設計で解いた、という発想の切り替えがこの技術の本質です。

実務面でとくに大きいのは、追加学習が要らない「プラグアンドプレイ型」である点です。巨大モデルを再訓練するには莫大な計算資源と時間がかかりますが、本手法は推論時の計算だけで既存のあらゆるLVLMに後付けできます。導入のハードルが低いということは、それだけ社会へ広がる速度も速いことを意味します。

応用が見込まれる領域も具体的です。NTTは医療画像診断や重大な意思決定を支える対話エージェントを挙げ、報じる他メディアはこれに加え、ビジネスデータ分析や自動運転への展開にも言及しています。いずれも「答えが当たっているか」だけでなく「なぜそう判断したかを後から検証できるか」が決定的に重要な分野ばかりです。

ポジティブな側面は明快です。判断の理由をたどれるAIは、ミスが起きたときに原因を特定でき、責任の所在も追いやすくなります。EUのAI規制（AI Act）をはじめ、世界の制度設計は「高リスク用途では説明可能性を備えよ」という方向へ進んでおり、本技術はその要請に技術側から応える一手になり得ます。

一方で、過度な期待は禁物です。根拠と答えの一貫性が保証されることと、その根拠そのものが正しいことは別問題です。誤った根拠に忠実な答えは、やはり誤ります。「説明できる」ことが「正しい」ことの保証だと受け取られれば、かえって人間の警戒心を緩める危うさもはらみます。透明性は信頼の入り口ではあっても、信頼そのものではない── この一線は、読者の皆さんと共有しておきたい視点です。

長期的に見れば、この技術は「複数のAIが互いの判断根拠を確かめ合う」未来への布石でもあります。NTTが掲げる多数のAIを連携させる構想「AIコンステレーション」では、AI同士が根拠を提示し合えることが連携の前提になります。人がAIを信じるためだけでなく、AIがAIを信じるための共通言語として、説明可能性は基盤技術になっていくはずです。今回の成果は、その長い道のりの確かな一歩だと位置づけられます。

【用語解説】

大規模視覚言語モデル（LVLM）
大規模言語モデル（LLM）に画像を読み取る機能を組み合わせたAIである。文章だけでなく画像や動画も直接入力でき、視覚情報とテキストをあわせて理解・推論できる。

Chain-of-Thought（CoT、思考の連鎖）
AIが結論を出す前に、その理由づけや途中の考えを段階的に書き出してから答えを導く推論手法である。推論精度の向上と、判断過程の説明の両方に役立つと考えられてきた。

根拠強化デコーディング（Rationale-Enhanced Decoding）
NTTが確立した推論手法。画像にもとづく推論と根拠にもとづく推論を別々に行い、出力直前で重みを付けて統合することで、AIが根拠を必ず使って答えるよう仕向ける技術である。

KLダイバージェンス制約
2つの確率分布がどれだけ離れているかを測る尺度がKLダイバージェンスである。本研究では、根拠を重視しつつも画像から得られる分布から大きく外れないよう、生成を縛る制約として用いられている。

プラグアンドプレイ
既存のものに差し込むだけですぐ使える、という性質を指す。本技術は追加学習を必要とせず、推論時の計算だけで既存のLVLMにそのまま組み込める。

説明可能AI（XAI、eXplainable AI）
AIがなぜその答えに至ったのか、判断の理由を人間が理解・検証できるようにする技術や考え方の総称である。

EUのAI規制（AI Act）
欧州連合が定めたAIに関する包括的な法規制。リスクの高い用途には透明性や説明可能性などの要件を課す方向で制度設計が進んでいる。

【参考リンク】

多様なAIが連携した「AIコンステレーション®」 | NTT R&D Website（外部）
多数の小型AIを連携させ集合知を生み出す、NTTの研究構想の公式解説ページ。

CVPR（Computer Vision and Pattern Recognition）（外部）
本成果が発表されるコンピュータビジョン分野の国際会議の公式サイト。

Anthropic（外部）
Claude 3.7 Sonnetの開発元。CoTの忠実性に関する研究を公開する米国のAI企業。

OpenAI（外部）
ChatGPT-4oの開発元。生成AIを開発する米国企業の公式サイトである。

DeepSeek（外部）
推論モデルDeepSeek R1の開発元。中国のAI企業の公式サイトである。

【参考動画】

【参考記事】

Chain-of-Thought Reasoning In The Wild Is Not Always Faithful（外部）
自然なプロンプトでもCoTが実際の推論を忠実に反映しない場合があると示した論文。編集部解説で用いた数値の出典である。

Don’t believe reasoning models’ Chains of Thought, says Anthropic（VentureBeat）（外部）
推論モデルの思考過程を忠実な反映として信頼してよいのか、問題提起を伝える記事。

Anthropic study reveals LLM reasoning isn’t always what it seems（TechTalks）（外部）
AIの思考の連鎖が答えへの過程を必ずしも忠実に表さないという研究の紹介記事。

Measuring Faithfulness in Chain-of-Thought Reasoning（外部）
CoTの忠実性を体系的に測定したAnthropicの論文。依存度にばらつきがあると示した。

【編集部後記】

取材や検証を重ねるなかで、私たち自身が何度も立ち止まったのは「説明できること」と「正しいこと」の境目でした。理由を語れるAIは確かに頼もしく映りますが、語りが流暢であるほど、私たちは中身を確かめる手間を省きたくなります。今回の技術は、その油断にこそ光を当てているように思えました。便利になるほど問われるのは、使う側の問いの立て方なのかもしれません。皆さんと一緒に、その問いを手放さずにいたいと思っています。