【ダイジェスト】
OpenAIは、テキストの説明から高精細な映像クリップを生成する新しいビデオモデル「Sora」を開発しました。このモデルは、テキストからビデオを生成する技術の新たな研究方向を示しており、3Dオブジェクトの配置やオクルージョンの処理にも対応していますが、まだ完璧ではありません。Soraは、DALL-E 3の技術を応用し、拡散モデルとトランスフォーマーを組み合わせることで、多様なビデオの生成を可能にしています。
OpenAIは、Soraの安全性に対する懸念を考慮し、暴力的、性的、憎悪的なイメージや既知の人物のイメージをブロックするフィルターを組み込んでいます。しかし、これらの対策は完全ではなく、さらなる改善が必要です。現段階では、Soraは安全テスターやクリエイティブプロフェッショナルにのみ提供され、一般公開の予定はありませんが、将来的に製品化する計画があります。OpenAIは、フィードバックを収集し、Soraをより有用なツールにするための改善を目指しています。
ニュース解説
OpenAIが開発した「Sora」という新しいビデオモデルは、短いテキストの説明から詳細で高解像度の映像クリップを生成することができる技術です。このモデルは、テキストからビデオを生成するという最先端の研究分野において、3Dオブジェクトの配置やオクルージョン(視界からの物体の消失と再出現)の処理など、複雑な映像生成の課題に対応しています。しかし、完璧ではなく、特に長期間の一貫性の維持には課題が残っています。Soraは、OpenAIのテキストから画像を生成するモデル「DALL-E 3」の技術を基にしており、拡散モデルとトランスフォーマーを組み合わせることで、さまざまな種類のビデオを生成する能力を持っています。
この技術の安全性に対する懸念から、OpenAIはSoraにいくつかの安全対策を組み込んでいます。これには、暴力的、性的、憎悪的なイメージや既知の人物のイメージを生成するリクエストをブロックするフィルターや、生成されたビデオのフレームをチェックしてOpenAIの安全ポリシーに違反する内容をブロックするフィルターが含まれます。しかし、これらの対策は完全ではなく、偽画像検出器やメタデータの埋め込みなど、さらなる改善が求められています。
現段階では、Soraは安全テスターや選ばれたクリエイティブプロフェッショナルにのみ提供されており、一般公開の予定はありません。しかし、将来的には製品化される可能性があり、OpenAIはフィードバックを収集し、Soraをより有用なツールにするための改善を目指しています。
この技術がもたらすポジティブな側面としては、映画制作、アニメーション、広告などの分野での創造的な表現の可能性が広がることが挙げられます。一方で、偽情報やディープフェイクの拡散といった潜在的なリスクも伴います。規制や倫理的なガイドラインの整備が、この技術の健全な発展には不可欠です。
将来的には、Soraのようなモデルがさらに進化し、よりリアルで長時間のビデオ生成が可能になることで、エンターテイメント業界だけでなく、教育やトレーニング、仮想現実など、幅広い分野での応用が期待されます。そのためには、技術的な改善とともに、社会的な受容と倫理的な考慮が重要な課題となるでしょう。
from OpenAI teases an amazing new generative video model called Sora.