トヨタWoven City、視覚言語AIモデル「AI Vision Engine」を公開──Inventorsは計24社へ

トヨタWoven City、視覚言語AIモデル「AI Vision Engine」を公開──Inventorsは計24社へ

トヨタ自動車株式会社とウーブン・バイ・トヨタ株式会社は2026年4月22日、2025年9月に正式オープンしたToyota Woven Cityにて、産業横断の連携による価値創出「カケザン」を加速する取り組みを公開した。中核技術のWoven City AI Vision Engineは、視覚と言語を統合的に扱うVision Language Model(VLM)であり、MVBench Leaderboardで世界トップレベルの性能を持つ。同技術はWoven City Behavior AIやWoven City Drive Sync Assistと連携し、Woven City Integrated ANZEN Systemに活用されている。4月にはトヨタ自動車東日本株式会社東富士工場のプレス建屋を改修したWoven City Inventor Garageが稼働を開始した。新たに一般社団法人AIロボット協会、株式会社第一興商、Joby Aviation, Inc.、トヨタファイナンシャルサービス株式会社の4社がInventorsに加わり、計24となった。

From: 文献リンクトヨタおよびウーブン・バイ・トヨタ、カケザンを加速するAI技術やしくみを公開

【編集部解説】

トヨタとウーブン・バイ・トヨタ(WbyT)が今回公開したWoven Cityの新たな展開は、単なるスマートシティの進捗報告ではありません。2025年9月の正式オープンから約7か月、いよいよ「実証する街」が「価値を生み出す街」へとフェーズを移したことを象徴する発表だと、編集部は受け止めています。

注目すべき第一のポイントは、Woven City AI Vision Engineという大規模基盤AIモデルの存在です。これは、カメラ映像などの視覚情報をリアルタイムで言語化して理解・判断するVision Language Model(VLM/視覚言語モデル)であり、動画理解AIの性能評価指標であるMVBench Leaderboardで世界トップクラスの性能を持つとされています。

VLMという技術自体は、Google(Gemini 2.5 Pro)や、AlibabaのQwen 2.5-VL、Metaなどが激しく競っている領域です。そこに自動車メーカーであるトヨタが、しかも「街」という現実空間で鍛え上げた基盤モデルを提示してきた点が極めて重要だと言えます。

なぜ自動車メーカーがVLMを開発するのか。答えは明快で、自動運転、ロボティクス、製造現場の品質管理など、トヨタの中核事業すべてが「視覚情報を理解して行動につなげる」技術に直結しているからです。Automotive Newsはこのリリースを「中国とのAI覇権競争が激化するなかでの一手」と位置づけており、編集部もこの見方に同意します。

第二のポイントは、AI Vision Engineを核としたWoven City Integrated ANZEN Systemという安全システムです。クルマや信号機のカメラ映像を解析し、歩行者やドライバーの行動を予測して事前に通知するこの仕組みは、いわゆる「インフラ協調型自動運転」の現実解として注目に値します。個々のクルマの賢さを競うTeslaのアプローチとは異なり、街全体で安全を支える日本らしい思想が反映されています。

第三のポイントが、東富士工場プレス建屋を改修した「Inventor Garage」の稼働開始です。50年以上にわたって乗用車を生産してきた工場跡地を、スタートアップや大企業のInventorsが集う発明拠点へと再生したという事実は、日本のモノづくりの転換点として象徴的です。延床面積は約24,000平方メートル、地下1階・地上2階建ての規模で、プレス機が並んでいた空間に3Dプリンターやプロトタイピング設備が入り、宿泊施設まで備えています。「ハードウェアスタートアップが日本で育ちにくい」という長年の課題への、トヨタなりの回答とも読めます。

第四のポイントは、新たに参画した4社の顔ぶれです。一般社団法人AIロボット協会(AIRoA)は、川田テクノロジーズやNEC、富士通など22社以上が参画する「オールジャパン」のロボット基盤モデル開発組織で、日本のフィジカルAI戦略の中核を担う団体です。Joby Aviationは、トヨタがこれまでに累計894 million USドル(約1,341億円/1ドル=150円換算)を出資してきた米eVTOLスタートアップで、空飛ぶタクシーの商用化目前の段階にあります。第一興商は4月17日に独自リリースを出し、「選曲レスカラオケ」(趣味や年齢からAIが自動選曲する仕組み)の実証を発表済みです。トヨタファイナンシャルサービスは「モビリティ価値の計測・証明・流通」という、いわばモビリティ版の信用スコアリングに取り組みます。

陸(クルマ・ロボット)、空(eVTOL)、エンターテインメント、金融。この4分野の同時参画は、Woven Cityが単なる「自動車の街」ではなく、生活全体をAIで再構築する場へと拡張していることを示しています。

そして最も興味深い、ある意味で物議を醸しそうなのが「豊田章男AI」の存在です。会長自身の過去のスピーチやインタビューを学習させたこのAIは、章男会長そっくりの声と話し方で質問に答えるとされ、海外メディアではすでにデモ映像が話題となっています。「経営者の思考と価値観をAIとして継承する」という試みは、世界的にも前例の少ない挑戦です。

ただし、ここには潜在的なリスクもあります。経営者AIが意思決定に関与し始めた場合、その判断責任は誰が負うのか。ディープフェイク技術との境界線をどう引くのか。声紋という個人情報の取り扱いはどうするのか──こうした論点は、今後の規制議論にも直結するでしょう。

長期的な視点で見ると、Woven Cityの取り組みは、欧米のAI規制(EU AI Actなど)が「リスクベース」での規制を志向するのに対し、「実証ベース」で社会実装を進める日本独自のアプローチを体現していると言えます。Phase 1には現在約100名のWeavers(住民)が暮らし、Phase 1全体では最終的に約300名の居住が予定されています。Woven City全体の構想では、将来的に約2,000名規模までの拡大が描かれており、一般来訪者の受け入れも2026年度から始まる予定です。私たちが実際にこの街を体感できる日は、確実に近づいています。

トヨタが「カケザン(×)」という言葉に込めたのは、単なる業務提携ではなく、異業種の知見が掛け合わさることで指数関数的に新しい価値が生まれるという思想です。AI時代におけるオープンイノベーションの一つの解答として、富士山麓のこの実験都市が世界に何を示すのか──innovaTopia編集部は、引き続き注視していきます。

【参考情報】

Vision Language Model(VLM/視覚言語モデル)
画像や動画の視覚情報と、自然言語のテキストを同時に処理できる大規模AIモデルの総称である。画像の内容を文章で説明したり、映像内で起きている事象を言語化して判断したりすることができる。Google Gemini、Alibaba Qwen-VL、OpenAI GPT-4Vなどが代表例として知られる。

MVBench Leaderboard
動画理解AIの性能を多面的に評価する国際的なベンチマーク(性能評価指標)である。動作認識、物体追跡、シーン理解など複数のタスクで動画ベースのAIモデルの能力を測定する。

基盤モデル(Foundation Model)
膨大なデータで事前学習された汎用的な大規模AIモデルを指す。一つの基盤モデルから、用途に応じてさまざまなアプリケーションを派生させることができる。

Kakezan(カケザン)
ウーブン・バイ・トヨタが提唱する造語的コンセプトである。異なる業界や専門性を「掛け合わせる(×)」ことで、足し算では生まれない指数関数的な価値創出を目指すという思想を表す。

eVTOL(イーブイトール)
Electric Vertical Take-Off and Landingの略称で、完全電動式の垂直離着陸機を意味する。滑走路を必要とせず、ヘリコプターのように垂直に離着陸できる電動航空機であり、いわゆる「空飛ぶクルマ」「空飛ぶタクシー」の中核技術として位置づけられている。

Inventor / Weaver
Inventorはウーブン・シティで自らのプロダクトやサービスを開発・実証する企業や個人を指す呼称である。Weaverは同シティに居住・勤務、または訪問し、実証実験に参加する人々を指す。

Master Weaver
ウーブン・シティ全体を象徴する立場としてつけられた呼称で、トヨタ自動車会長のトヨダ・アキオ氏がこの役割を担っている。

フィジカルAI
ロボットや自動運転車など、現実世界で身体を持って動作するハードウェアにAIを実装する研究領域を指す。生成AIなどデジタル空間内のAIと対比される概念である。

インフラ協調型自動運転
車両単体のセンサーやAIだけに頼らず、信号機や道路に設置されたカメラ・センサーなどインフラ側の情報も組み合わせて自動運転や運転支援を実現する考え方である。

【参考リンク】

トヨタ自動車株式会社 公式サイト(外部)
日本を代表する自動車メーカー。1937年創業。コネクティッド・自動化・電動化などを軸にモビリティカンパニーへの転換を進めている。

Woven by Toyota(ウーブン・バイ・トヨタ株式会社) 公式サイト(外部)
トヨタグループのソフトウェア・モビリティ開発会社。自動運転、ソフトウェア基盤Arene、Toyota Woven Cityなどを手がける。

Toyota Woven City 公式サイト(外部)
静岡県裾野市のモビリティ実証実験都市の公式サイト。Inventor企業や最新ニュース、参加方法などの情報が掲載されている。

Joby Aviation 公式サイト(外部)
米国カリフォルニア州サンタクルーズ拠点のeVTOL開発スタートアップ。トヨタの出資を受け空飛ぶタクシー実用化を目指す。

一般社団法人AIロボット協会(AIRoA) 公式サイト(外部)
2024年12月設立の非営利団体。日本企業を結集し、AI×ロボットの基盤モデルとデータエコシステム構築を推進している。

株式会社第一興商 公式サイト(外部)
業務用カラオケDAMやビッグエコーを展開する国内最大手のカラオケ企業。Woven Cityでは選曲レスカラオケの実証を行う。

トヨタ自動車東日本株式会社(TMEJ) 公式サイト(外部)
東北地方を中心に小型車などを生産するトヨタグループ会社。同社東富士工場跡地がWoven Cityの母体となっている。

【参考記事】

Toyota unveils one of world’s top AI vision engines at Japan test bed as race with China heats up(Automotive News)(外部)
トヨタAI Vision Engineを中国とのAI覇権競争激化のなかでの一手と位置づけ、自動運転やロボティクスへの応用戦略を解説。

eVTOL maker Joby buys new factory, doubling manufacturing footprint(CNBC)(外部)
Jobyがオハイオ州デイトンに製造施設を取得し製造能力を倍増。トヨタからの累計894 million USドル出資にも触れている。

Toyota opens mobility innovation hub at Shizuoka’s Woven City(Nation Thailand)(外部)
Inventor Garageが延床面積約24,000平方メートル、地下1階・地上2階建てであることを伝える時事通信配信記事。

Toyota Woven City Officially Launches as a Test Course for the Future of Mobility(Toyota Global Newsroom)(外部)
2025年9月25日のWoven City正式オープンを伝える公式リリース。Phase 1で最終約300名の居住予定を明記している。

Toyota Opens $10B ‘Woven City’ in Japan to Test Life with Robots and AI(Parametric Architecture)(外部)
Woven Cityの総投資額を10 billion USドル規模と報じ、2025年9月の正式オープン式典の様子を伝えた専門メディア記事。

Toyota’s “Woven City” Unveils Corporate Development Hub, Showcasing Akio Toyoda AI(BigGo Finance)(外部)
豊田章男AIのデモを詳細に伝える記事。本人そっくりの声と話し方で質問に応答する様子をレポートしている。

《日経Robotics》オールジャパンでロボAI開発へ、AIロボット協会発足(日経xTECH)(外部)
AIロボット協会(AIRoA)の発足を報じた専門記事。多様な分野から計22社が集結したオールジャパン体制を解説。

【編集部後記】

富士山麓に静かに立ち上がる「未来の街」では、いま、私たちが当たり前に享受している交通や安全、エンターテインメントの形が、根本から問い直されています。AIが街全体を見守り、空飛ぶタクシーが日常の風景になる──そんな光景を、皆さんはワクワクして迎えますか。それとも少し戸惑いを感じますか。経営者の思考をAIで継承する試みについては、どんな可能性とリスクを思い浮かべるでしょうか。「未来の当たり前」が形になる前のいま、自分なりの問いを持って眺めてみると、技術ニュースの景色が少し変わって見えるかもしれません。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です