Google DeepMindが新しい生成モデル「Genie」を開発しました。このモデルは、短い説明、手描きのスケッチ、または写真から、スーパーマリオブラザーズのようなクラシックな2Dプラットフォーマー風のプレイ可能なビデオゲームをゼロから作成することができます。ただし、生成されるゲームは1秒間に1フレームの速度で動作し、現代のゲームの一般的な30〜60フレーム/秒と比べると遅いです。
Genieはインターネットから取得した数百の2Dプラットフォームゲームのビデオ30,000時間分でトレーニングされました。このモデルはビデオ映像のみを使用してトレーニングされ、プレイヤーが取る可能性のある8つのアクションを学習し、それに応じてゲームキャラクターの位置が変わるようにしました。Genieはプレイヤーがアクションを取るたびに、そのアクションに応じて新しいゲームフレームをリアルタイムで生成します。
Google DeepMindの研究チームは、将来的にGenieをより高速に動作させる可能性があると述べています。また、Genieはプラットフォーマーゲームによく見られる視覚的な特徴、例えば前景が背景よりも速く横に動くパララックス効果を生成することも学習しました。
Genieは現在社内の研究プロジェクトであり、公開される予定はありませんが、将来的にゲーム作成ツールになる可能性があります。さらに、Google DeepMindの研究者たちは、AI制御のボットが様々なタスクを試行錯誤で学ぶための仮想環境を作成することにも関心を持っています。この技術は将来のロボットがビデオチュートリアルを見ることで新しいタスクを学ぶのに役立つかもしれません。
【ニュース解説】
Google DeepMindが開発した新しい生成モデル「Genie」は、短い説明や手描きのスケッチ、写真から、スーパーマリオブラザーズのようなクラシックな2Dプラットフォーマーゲームをゼロから作成する能力を持っています。この技術は、現代のゲーム開発における新たな可能性を示唆していますが、生成されるゲームは1秒に1フレームという速度で動作し、現代のゲームの標準的なフレームレートと比較すると非常に遅いです。
Genieのトレーニングには、インターネットから収集された2Dプラットフォームゲームのビデオ30,000時間分が使用されました。このモデルは、ビデオ映像のみをトレーニングデータとして使用し、プレイヤーが取りうる8つのアクションを学習して、それに応じてゲームキャラクターの位置を変更します。これにより、プレイヤーがアクションを取るたびに、新しいゲームフレームがリアルタイムで生成される仕組みです。
この技術の応用範囲は広く、将来的にはより高速に動作するバージョンの開発が期待されています。また、Genieが学習したプラットフォーマーゲームの視覚的特徴、特にパララックス効果のようなものは、ゲームのリアリズムと没入感を高める要素として注目されます。
現段階ではGenieは研究プロジェクトとして内部でのみ使用されていますが、将来的にはゲーム作成ツールとしての公開も検討されています。この技術が一般に公開されれば、プログラミングスキルがない人でも簡単にオリジナルゲームを作成できるようになるかもしれません。
さらに、Google DeepMindの研究者たちは、AI制御のボットが様々なタスクを試行錯誤で学ぶための仮想環境の作成にも関心を持っています。この技術は、将来のロボットがビデオチュートリアルを見ることで新しいタスクを学ぶのに役立つ可能性があります。これは、ロボティクスやAIの分野における学習方法の革新を意味し、より効率的で柔軟なロボットの開発に寄与するかもしれません。
この技術のポジティブな側面としては、ゲーム開発の民主化、教育やトレーニング用途での応用、創造性の促進などが挙げられます。一方で、潜在的なリスクとしては、著作権や知的財産権の問題、不適切なコンテンツの生成、AIの判断に依存しすぎることによる倫理的な問題などが考えられます。規制に関しては、AI技術の進展に伴い、これらの問題に対処するための新たな法律やガイドラインの策定が必要になるでしょう。
長期的な視点では、Genieのような技術は、ゲーム開発だけでなく、教育、エンターテイメント、ロボティクスなど、多岐にわたる分野での革新を促進する可能性があります。これにより、私たちの生活や働き方に大きな変化をもたらすかもしれません。
from Google DeepMind’s new generative model makes Super Mario-like games from scratch.