OpenAIは、テキストから超現実的なシーンを生成できるビデオジェネレーター「Sora」を今年中に一般公開する予定であることを発表しました。当初、Soraは視覚芸術家、デザイナー、映画製作者向けにのみ提供されていましたが、一般公開に向けて、将来的には音声の組み込みや、AIが生成したコンテンツの編集機能の追加が計画されています。OpenAIの最高技術責任者(CTO)であるミラ・ムラティは、Soraのトレーニングに使用されたデータについて詳細は明かさず、公開データやライセンスされたデータを使用していると述べました。また、Shutterstockとのパートナーシップを通じてコンテンツを使用していることも確認しています。
ムラティは、Soraを動かすコストが高いものの、公開時にはDALL-Eと同様のコストで提供することを目指していると述べました。さらに、2024年の大統領選挙を控え、生成AIツールによる誤情報の潜在的なリスクが高まっている中、Soraが公開された際には、公共の人物の画像生成を制限し、ビデオには実物と区別するためのウォーターマークが付けられる予定です。
【ニュース解説】
OpenAIが開発したテキストから超現実的なシーンを生成するビデオジェネレーター「Sora」が、今年中に一般公開される予定です。当初は視覚芸術家やデザイナー、映画製作者向けに提供されていましたが、今後は一般ユーザーも利用できるようになります。さらに、将来的には音声の組み込みや、AIが生成したコンテンツの編集機能が追加される計画です。
Soraの開発にあたっては、公開データやライセンスされたデータが使用されており、特にShutterstockとのパートナーシップを通じてコンテンツが利用されています。しかし、具体的にどのようなデータがトレーニングに用いられたのかについては、詳細が公開されていません。
Soraを動かすコストは高いものの、OpenAIは公開時にはDALL-Eと同様のコストで提供することを目指しています。これにより、より多くのユーザーがこの革新的なツールを利用できるようになることが期待されます。
しかし、2024年の大統領選挙を控え、生成AIツールによる誤情報の拡散リスクが高まっていることから、Soraにはいくつかの制限が設けられる予定です。公共の人物の画像生成が制限され、ビデオには実物と区別するためのウォーターマークが付けられます。これにより、誤情報の拡散を防ぐための対策が講じられることになります。
Soraの一般公開は、コンテンツ制作の分野において大きな可能性を秘めています。テキストから簡単に高品質なビデオを生成できることで、映像制作のハードルが大きく下がり、クリエイティブな表現の幅が広がることが期待されます。一方で、生成されたコンテンツの真偽を見分けることが難しくなる可能性もあり、社会的な課題としての側面も持ち合わせています。
将来的には、Soraのような技術がさらに進化し、リアルタイムでのビデオ生成や、より複雑なシナリオの実現が可能になるかもしれません。しかし、その一方で、誤情報の拡散や著作権の問題など、新たな課題に直面する可能性もあります。このため、技術の発展とともに、適切な規制やガイドラインの整備が求められるでしょう。
from OpenAI’s Sora text-to-video generator will be publicly available later this year.