NTT株式会社は2025年11月、脳の活動から人が見ている映像や思い浮かべた内容を、AIを用いて高精度に文章化する「マインド・キャプショニング」を発表した。
この技術は、fMRIなどの脳計測データをAIや深層言語モデルと組み合わせることで、ヒトが実際に見ている・想起している動画の内容を言語化できることを示している。実験では、100本の候補動画のうち知覚時には約50%、想起時には約30%の精度で正しい映像を文章から同定できた。また、言語処理を担う脳部位を使わずとも同等精度が得られ、非言語的な思考やイメージも文章化できることが証明された。
成果は医療・介護分野での意思伝達支援や発話困難者への応用、さらに言葉にできない感情や意図の理解につながる可能性を示している。一方で、深い分析と大量の脳活動データが必要となり、プライバシーや倫理的なリスクへの慎重な議論も求められている。
今回の研究成果は2025年11月5日、米国の学術誌Science Advancesに掲載され、NTT R&D FORUM 2025でも紹介予定である。
From:
心に思い浮かべた映像を言葉に変換する脳解読技術「マインド・キャプショニング」を実現~言葉を使わずに考えを伝える新たなコミュニケーション手段を開拓~ | ニュースリリース
【編集部解説】
NTTが研究成果を発表した「マインド・キャプショニング」は、脳解読技術と言語AIの融合により、思い浮かべた映像や実際に目にしたものを文章として出力できる先進的なシステムです。本技術の最大の特徴は、人間の脳内で映像として記憶・想起される非言語的な内容を、脳活動データから直接テキスト生成できる点にあります。これまでの研究では、言語的思考や言語野の活動に依存した解析が中心でしたが、本技術は脳の言語野以外の広い領域(前頭葉・後頭葉など)からも情報を抽出し、意味ある文章に変換できます。
システムのコアは、fMRI(機能的磁気共鳴画像法)という高解像度の脳計測技術を下地とし、脳情報デコーディングモデルと深層言語モデル(DeBERTa-largeなど)を組み合わせる形です。第一段階で脳活動から言語モデルの意味特徴を予測し、第二段階でマスク単語を補完しながら精度の高い文章生成を複数回繰り返す独自プロセスが採用されています。
実際の検証では、映像を知覚・想起している被験者の脳活動から生成された文章の精度が高く、100本の候補動画から知覚条件で約50%、想起条件でも約30%の的中が報告されました。ふだんの生活や仕事だけでなく、医療やコミュニケーション支援など多様な分野への応用が想定されています。
特筆すべきは、言語野を除外した解析でも高い精度が得られたことで、従来「言語による考えの解読」を越えた、イメージや感覚もテキスト化できる可能性が示された点です。たとえば、感情や概念など、これまで言葉にできなかった情報もテキスト化される未来が近付いています。
しかし本技術の応用には、プライバシー、倫理面の課題も隣り合わせです。個人の思考や心の中をデジタル化することによる「心的プライバシー」の保護、AIの解釈精度やバイアスリスクへの対策、巨大な脳活動データの蓄積と管理など、社会的な議論や技術的なガイドライン整備が必要不可欠です。NTTの公式リリースでも、被験者の明確な同意やデータ運用ルールの重要性、透明性確保が強調されています。
また現時点で本技術は、大がかりな装置や長時間の計測を要し、即時的な実用化には至っていませんが、今後の進化や社会実装によって、医療の現場や日常生活、教育、創作の領域に大きなインパクトを与えることが期待されています。
【用語解説】
マインド・キャプショニング
脳活動からヒトが見た、または思い浮かべた映像の内容を言語化する技術。AIと言語モデルの組み合わせにより、非言語的思考を文章として出力できる。
脳情報デコーディング
fMRIなどで計測した脳活動データを解析し、心身の状態や思考内容を推定する技術。
fMRI(機能的磁気共鳴画像法)
MRI装置を用いて脳内の血流変化を非侵襲的に計測し、脳活動を分析する方法。
言語AIモデル
膨大な言語データを学習して、自然言語の生成や意味解析を行うAI構造。今回の研究ではDeBERTa-largeなどが使われた。
Science Advances
米国科学振興協会(AAAS)が発行する学術誌。先端科学分野の最新研究成果を発表する。
【参考リンク】
NTT株式会社公式サイト(外部)
日本を代表する情報通信企業。AI・通信・IT基盤など幅広い研究開発を進めている。
Science Advances(外部)
最新の科学技術研究成果を掲載するオープンアクセス学術雑誌。
NTT R&D FORUM 2025 IOWN Quantum Leap(外部)
NTTの最先端研究開発の成果発信イベント。AI・IoT・脳科学の最新展示が行われる。
【参考記事】
Scientists Just Built an AI That Can Basically Read Your Mind(外部)
NTTが脳活動から思考内容を文章化する技術を発表。実験では数十%の精度で動画内容の特定に成功した。
AI ‘Mind Captioning’ System Translates Brain Activity into Text(外部)
NTTのマインド・キャプショニング技術を紹介。医療や介護分野での可能性にも触れている。
Scientists can now caption your thoughts. What could go wrong?(外部)
NTTの技術とともに倫理・プライバシー課題にも言及。社会的インパクトの解説が詳しい。
【編集部後記】
今回ご紹介したNTTの「マインド・キャプショニング」は、脳の仕組みやAIの進化を考えるうえでとても興味深いテーマです。自らのアイデアや感情が、言葉を介さずに伝わる――それは、これまでになかったコミュニケーションを生むかもしれません。一方で、心のプライバシーという新たな倫理的課題もあります。この技術にみなさんはどんなことを期待し、あるいはどんな懸念や疑問を感じますか。今回の記事が、読者の皆様にとって、自らの思考とテクノロジーの未来について深く考えるきっかけとなれば幸いです。

