【ダイジェスト】
Stability AIは、新しい画像生成AIモデル「Stable Cascade」を発表しました。このモデルは、業界をリードする前作「Stable Diffusion」よりも高速で強力であり、写真の生成や既存の画像の解像度向上、画像の一部を編集するインペインティングやアウトペインティング、既存の画像のエッジを使用して新しい写真を作成するキャニーエッジなど、さまざまなテキストから画像への編集機能を提供します。
Stable CascadeはGitHub上で研究者向けに提供されていますが、商用利用はされていません。このモデルは、GoogleやAppleなど他の企業が自社の画像生成モデルをリリースする中で、より多くのオプションを提供します。Stable Cascadeは、Stable Diffusionモデルとは異なり、Würstchenアーキテクチャに基づく3つの異なるモデルで構成されています。テキストプロンプトを小さなコードの断片に圧縮し、それをデコードするために他のステージに渡すことで、メモリの使用量を減らし、GPUのトレーニング時間を短縮しながら、プロンプトの整合性と美的品質の両方で優れた性能を発揮します。画像の生成にかかる時間は、現在使用されているSDXLモデルの22秒に対して約10秒です。
Stability AIは、安定拡散法を普及させたことで知られていますが、著作権データを許可なくトレーニングに使用したとして複数の訴訟の対象となっています。Getty Imagesによる英国での訴訟は12月に裁判にかけられる予定です。同社は研究資金を支援するために、12月から商用ライセンスをサブスクリプションを通じて提供し始めました。
【ニュース解説】
Stability AIが新しい画像生成AIモデル「Stable Cascade」を発表しました。このモデルは、以前のバージョン「Stable Diffusion」を上回る速度と能力を持ち、写真生成や画像の解像度向上、特定部分の編集など、多様な機能を提供します。Stable Cascadeは、Würstchenアーキテクチャに基づく3つの異なるモデルで構成されており、テキストプロンプトをより小さなコードの断片に圧縮して処理することで、メモリ使用量を減らし、処理速度を向上させています。このモデルはGitHub上で研究者向けに提供されていますが、商用利用はまだ許可されていません。
この技術の進化は、画像生成AIの分野における競争の激化を示しています。GoogleやAppleなどの大手企業も独自の画像生成モデルをリリースしており、Stability AIはこの競争において一歩先を行くためにStable Cascadeを開発しました。このモデルは、より少ない計算リソースで高速に高品質な画像を生成できるため、研究や開発におけるコスト削減に貢献する可能性があります。
しかし、Stability AIは過去に著作権データを無許可で使用したとして訴訟に直面しており、この問題はAI技術の発展における重要な課題の一つです。著作権保護されたデータの使用は、AIモデルのトレーニングにおいて品質と多様性を確保する上で重要な要素ですが、権利者の許可なく使用することは法的な問題を引き起こします。このような問題は、AI技術の商用化と普及において、適切な規制やガイドラインの整備が求められる理由の一つです。
Stable Cascadeの登場は、AIによる画像生成技術の可能性をさらに広げるものです。例えば、デザインやアート、広告業界では、このようなツールを使用して創造的なビジュアルコンテンツを迅速に生成することができます。また、教育や研究分野でも、視覚的な資料の作成に役立つでしょう。しかし、この技術の発展は、著作権侵害やデータのプライバシー問題など、新たな課題をもたらす可能性もあります。したがって、技術の進歩とともに、これらの課題に対処するための法的・倫理的枠組みの整備が重要となります。
長期的には、Stable Cascadeのようなモデルがさらに進化し、よりリアルで多様な画像を生成できるようになることが期待されます。これにより、クリエイティブ産業だけでなく、教育、エンターテイメント、さらには医療分野においても、新たな応用が生まれる可能性があります。しかし、そのためには、技術の進歩を支える研究開発の持続可能性と、社会的な受容性を確保するための努力が不可欠です。
from Stability AI tries to stay ahead of the pack with a new image-generating AI model.