Google「Project Genie」がStreet View統合──月額200ドルで体験するAIワールドモデル

Googleは2026年5月19日、Google DeepMindの汎用ワールドモデルGenieに、Google Street Viewの画像を組み合わせる新機能「Street Viewグラウンディング」を、実験的プロトタイプProject Genieで提供開始したと発表した。

利用者はMapsピンで米国内の場所を選び、「Ocean World」「Desert Sands」「Stone Age」「B&W film」などのスタイルとキャラクターを指定することで、Street Viewの実世界画像に開始地点が結びついた仮想世界を生成できる。基盤技術はMaps Imagery Groundingである。海中のゴールデンゲートブリッジや1920年代のフォートワース・ストックヤードといった生成例が示された。

本日から月額200ドルのGoogle AI Ultra契約者（18歳以上）に対し、グローバルで段階的にロールアウトされる。Street View画像は現時点で米国内のみ対応で、今後拡大予定である。発表者はディエゴ・リバス、ジョナサン・ハーバート、ニコール・セガランの3名。

From: Simulate real-world places with Project Genie and Street View

【編集部解説】

今回の発表は、Google I/O 2026の文脈のなかに位置づけて読み解く必要があります。CEOのスンダー・ピチャイ氏が同日「agentic Gemini era（エージェント型Geminiの時代）」を宣言したように、Googleの戦略の中心は「単に応答するAI」から「世界のなかで行動するAI」へとシフトしています。Street View × Project Genieは、その世界観を象徴する一手なのです。

そもそも「ワールドモデル」とは何でしょうか。一般的な動画生成AI（Veoなど）が「決められた映像を再生する」のに対し、ワールドモデルは「物理法則や空間構造を内部に持ち、ユーザーの行動に応じて環境を生成し続ける」AIを指します。Genie 3は2025年8月に公開され、720pの解像度・24fpsで数分間にわたって整合性を保つ仮想空間を、テキストプロンプトから生み出せることが大きな飛躍とされました。

Genieの系譜を振り返ると、Genie 1（2024年2月、2D生成）、Genie 2（2024年12月、3D世界生成と短時間のインタラクティブ生成）、Genie 3（2025年8月、リアルタイム性の獲得）、そしてProject Genieの実験的提供開始（2026年1月29日、米国Google AI Ultra契約者向け）と、おおむね8〜9か月ごとに世代を更新してきました。今回はその延長線上で、グローバル展開と「現実への接地」が同時に行われた格好です。

ここで核心的なのは「グラウンディング（grounding）」という概念です。生成AIが空想を広げる方向に進化してきたのに対し、Street Viewとの接続は逆方向──つまり「現実に錨を下ろす」方向への進化を意味します。これは、ハルシネーション（幻覚）の制御や、AIが現実世界の物理・空間構造を学ぶための極めて重要な転換点だと言えるでしょう。

ビジネスインパクトも見逃せません。同じGenie 3エンジンは、すでに2026年2月からWaymoが自社の「Waymo World Model」として採用し、自動運転車を竜巻や象との遭遇といった「めったに起きないが命に関わるシナリオ」で訓練するために使われています。つまりProject Genieは、コンシューマー向けの体験提供と、ロボティクス・自動運転の合成訓練データ生成という、2つの巨大市場を同じ基盤技術で押さえる戦略の表層とも読み解けます。

ポジティブな側面として、教育・観光・歴史考証・都市計画など、応用範囲は広大です。1920年代のフォートワース・ストックヤードを歩けるという例は、過去の街並みを没入的に追体験できる「タイムマシン的観光」の萌芽を示しています。日本の読者にとっても、いずれ京都や東京の古地図をベースに「江戸の街を歩く」体験が可能になる未来は十分に想像できます。

一方で、潜在的なリスクも直視する必要があります。Street Viewの実在画像をベースに「現実とは異なる世界」を生成できるということは、特定の場所をめぐる誤情報やディープフェイク的な視覚コンテンツの温床になりうるということです。さらに、生成された世界における肖像権や所有権、商標の扱いには、既存法との関係を含めて未整理の論点が残ります。

技術的な制約も率直に押さえておきたい点です。海外の報道によれば、DeepMindの研究者ジャック・パーカー＝ホルダー氏自身が、現状のワールドモデルは精度と品質の面で「動画生成AIに6〜12か月遅れている」と認めており、少なくともProject Genieの一般向け体験では、現時点で写実性や細部の正確性に制約があり、様式化された表現も多いと見られます。Google自身も「実験的研究プロトタイプ」と明記しており、過度な期待は禁物です。

そして長期的視点で最も注目すべきは、ワールドモデルが「AGI（汎用人工知能）への踏み石」と位置づけられている点です。AIが世界の動きを予測し、自分の行動の結果をシミュレートできるようになることは、テキストや画像の生成とは質の異なる知能の段階を意味します。Street Viewという既存の巨大資産と組み合わせることで、Googleは他社が容易に追随できない「現実接地済みのワールドモデル」というポジションを取りに来た──そう読み解くこともできるでしょう。

【用語解説】

ワールドモデル（World Model）
AIが現実世界の物理法則・空間構造・因果関係を内部表現として学習し、その理解にもとづいて環境を生成・予測できるモデル。動画生成AIが「決められた映像を再生する」のに対し、ワールドモデルは「ユーザーや他のエージェントの行動に応じて環境を生成し続ける」点が決定的に異なる。

グラウンディング（Grounding）
AIモデルの出力を、現実世界の具体的なデータ（画像、地図、センサー情報など）に「接地」させる技術。今回はStreet Viewの実写画像を生成世界の起点とすることで、空想に走りがちな生成AIを現実に錨を下ろす役割を果たす。

AGI（汎用人工知能）
Artificial General Intelligenceの略。特定タスクに特化したAIとは異なり、人間と同等以上の幅広い知的タスクをこなせる汎用的なAIを指す。Google DeepMindはワールドモデルをAGIへの「踏み石（stepping stone）」と位置づけている。

ハルシネーション（幻覚）
生成AIが事実と異なる内容を、もっともらしく出力してしまう現象。空間生成AIにおいては、地理的・物理的にあり得ない構造を生成することなどが該当する。

24fps / 720p
fps（frames per second）は1秒あたりのフレーム数で、24fpsは映画と同等のフレームレート。720pは縦解像度720ピクセルのHD画質。Genie 3はこの仕様で数分間のリアルタイム生成を維持できることが技術的飛躍とされる。

【参考リンク】

Project Genie（Google Labs）（外部）
Genie 3を体験できる実験的プロトタイプ。Google AI Ultra契約者向けの公式入り口である。

Genie 3（Google DeepMind公式ページ）（外部）
Genie 3モデルの技術概要、現在の能力と制約、デモ映像が掲載された公式ページ。

Genie 3: A new frontier for world models（DeepMindブログ）（外部）
2025年8月のGenie 3発表時のブログ。ワールドモデルとAGIへの道筋が解説されている。

Google AI Ultra（料金プランページ）（外部）
Project Genieが利用できる月額200ドルの最上位サブスクリプションプランの公式案内。

Maps Imagery Grounding（Google Maps Platform）（外部）
Street Viewの画像を生成AIの入力として活用するためのGoogle Maps Platform機能。

SIMA 2（DeepMindブログ）（外部）
仮想3D環境でプレイ・推論・学習するエージェント。Genieが訓練環境を提供する関係にある。

Waymo World Model（Waymo公式ブログ）（外部）
WaymoがGenie 3ベースで構築した自動運転車訓練用ワールドモデルの発表記事である。

I/O 2026: Welcome to the agentic Gemini era（Sundar Pichai）（外部）
Google I/O 2026の全体方針を、CEOのスンダー・ピチャイ氏が示した記事である。

【参考記事】

Google DeepMind connects Street View to Project Genie world model（The Next Web）（外部）
Street Viewが保有する2800億枚の画像とワールドモデルが接続されたと報じる記事。

Genie 3 Trains Waymo’s Robotaxis on Rare Scenarios（TechTimes）（外部）
Ultraプランの料金変更や、生成世界が様式化されたものに留まる点を指摘した記事。

World Models: Google Adds Street View Mode to Project Genie（WinBuzzer）（外部）
Street Viewのアーカイブが110か国・7大陸・2800億枚規模であると詳述している記事。

Google’s Genie world model can now simulate real streets with Street View（TechCrunch）（外部）
ロンドン配備ロボットの天候訓練など、エージェント用途を強調したI/O 2026レポート。

DeepMind thinks its new Genie 3 world model presents a stepping stone toward AGI（TechCrunch）（外部）
Genie 3の720p・24fps生成と、AGIへの「踏み石」としての位置づけを解説した記事。

Genie: Generative Interactive Environments（DeepMind Research）（外部）
2024年2月発表の初代Genie研究ページ。Genie 1の発表時期確認に用いた一次情報。

Google’s Genie 3: Real-time AI world model creates interactive 3D environments（R&D World Online）（外部）
「promptable world events」機能と、自動運転・デジタルツインへの応用を論じた記事。

【関連記事】

Google「Project Genie」がストリートビューと連携｜現実の街をAI世界に変換、Waymo自動運転訓練にも活用
2026年5月20日公開。本記事と同じProject GenieとStreet View統合を扱った続報の起点記事。ストリートビューの戦略的データ資産論を深掘り。

Waymo、ロンドン公道で自律走行テスト開始｜欧州初の商業市場、2026年内に展開へ
2026年4月15日公開。Waymo World Modelの解説を含み、ロンドン展開と本記事のGenie 3活用文脈を理解する上で重要。

Google Maps×生成AI──ストリートビューで“未来の風景”が見られる機能など追加、衛星画像の分析も大幅に短縮
2026年4月公開。Maps Imagery Grounding初出記事。本記事の基盤技術を深く理解する上で必読の前提情報。

Google DeepMind、AIワールドモデル「Project Genie」を米国で展開開始
2026年1月31日公開。Project Genieが米国Google AI Ultra契約者向けに初提供された際の報道。今回のグローバル展開の前史。

【編集部後記】

もし手のひらの上で、自分が育った街を「石器時代の世界」として歩けたら。あるいは、行ったことのない街を「モノクロのフィルム調」で再構築できたら──そんな問いに、現実的な選択肢が一つ加わったのが今回の発表ではないでしょうか。

みなさんなら、最初にどの場所を、どんな世界に書き換えてみたいですか。innovaTopia編集部としても、生成された世界のなかを歩く体験が、私たちの「場所」や「記憶」への向き合い方をどう変えていくのか、一緒に考えていけたら嬉しいです。