【ダイジェスト】
OpenAIが新しいテキストからビデオへ変換するAIモデル「Sora」を発表しました。このモデルは、テキストの指示に基づいてリアルで想像力豊かなシーンを作成することができます。Soraは、複数のキャラクター、特定の動きのタイプ、そして対象や背景の正確な詳細を含む複雑なシーンを作成する能力を持っているとされています。また、物体が物理的な世界でどのように存在するかを理解し、小道具を正確に解釈し、生き生きとした感情を表現する魅力的なキャラクターを生成することができるとOpenAIは述べています。
Soraは、静止画像に基づいてビデオを生成したり、既存のビデオの欠けているフレームを補ったり、ビデオを延長することも可能です。OpenAIのブログ投稿に含まれるSora生成のデモには、ゴールドラッシュ時代のカリフォルニアの空中シーンや、東京の電車内から撮影されたかのように見えるビデオなどがあります。ただし、複雑なシーンの物理を正確にシミュレートすることや、特定の原因と結果を適切に解釈することに苦労する可能性があるとしています。
現在、Soraは潜在的な害やリスクを評価している「レッドチーム」にのみ利用可能で、一部のビジュアルアーティスト、デザイナー、映画製作者にもフィードバックを得るためにアクセスが提供されています。OpenAIは、AIによる偽のフォトリアリスティックビデオが本物と間違えられる結果に対処する必要があると述べています。
【ニュース解説】
OpenAIが新たに発表したテキストからビデオへ変換するAIモデル「Sora」は、ユーザーが書いたプロンプトに基づいて、リアルで想像力豊かなシーンを含む最大1分間のフォトリアリスティックなビデオを作成することができます。この技術は、複数のキャラクターや特定の動きのタイプ、そして対象や背景の詳細を正確に描写する能力を持っているとされています。さらに、物体が物理的な世界でどのように存在するかを理解し、小道具を正確に解釈し、感情を豊かに表現するキャラクターを生成することが可能です。
Soraの技術は、静止画像からビデオを生成したり、既存のビデオの欠けているフレームを補ったり、ビデオを延長することもできます。しかし、複雑なシーンの物理を正確にシミュレートすることや、特定の原因と結果を適切に解釈することには苦労する可能性があるとされています。
この技術の導入により、映画製作、広告、教育コンテンツの制作など、多岐にわたる分野での応用が期待されます。例えば、脚本家が書いたシナリオを基に短編映画を素早く制作したり、教育資料として歴史的な出来事をビジュアル化したりすることが可能になります。また、デザイナーやアーティストにとっては、新たな創造の手段を提供し、表現の幅を広げることができるでしょう。
しかし、この技術には潜在的なリスクも存在します。AIによるフォトリアリスティックなビデオが本物と間違えられることで、偽情報の拡散やプライバシーの侵害などの問題が生じる可能性があります。このため、OpenAIは現在、潜在的な害やリスクを評価する「レッドチーム」にのみSoraの利用を許可しており、一部のビジュアルアーティスト、デザイナー、映画製作者にフィードバックを得るためにアクセスを提供しています。
長期的には、このような技術の発展が、コンテンツ制作の民主化を促進し、創造的な表現の新たな地平を開く可能性を秘めています。しかし、その一方で、技術の乱用を防ぐための規制や倫理的なガイドラインの整備が、今後の大きな課題となるでしょう。
from OpenAI introduces Sora, its text-to-video AI model.