FLUX.2発表、Google Nano Banana Proの4分の1コストで画像生成AIの新時代へ

FLUX.2発表、Google Nano Banana Proの4分の1コストで画像生成AIの新時代へ

ドイツのAIスタートアップBlack Forest Labsが2025年11月26日、画像生成・編集システムFLUX.2を発表した。同社は2024年にStable Diffusionの開発者Robin Rombach、Patrick Esser、Andreas Blattmannによって創業され、Andreessen Horowitz主導で3100万ドルの資金調達を実施した。FLUX.2は5つのモデルで構成され、Flux.2 [Pro]は1メガピクセル当たり0.03ドル、Flux.2 [Dev]は320億パラメータのオープンウエイトモデルである。ベンチマークではテキスト画像生成で66.6%の勝率を記録し、Qwen-ImageやHunyuan Image 3.0を上回った。最大10枚のリファレンス画像に対応し、4メガピクセル解像度での生成・編集が可能である。Google Gemini 3 Pro Image Preview(Nano Banana Pro)と比較して、1K-2K画像で約4分の1、4K出力で約8分の1のコストとなる。Apache 2.0ライセンスのFlux.2 VAEとFlux.2 [Klein]がオープンソースとして提供される。

From: 文献リンクBlack Forest Labs launches Flux.2 AI image models to challenge Nano Banana Pro and Midjourney

【編集部解説】

今回のFLUX.2リリースで最も注目すべきは、画像生成AIが「実験的なツール」から「業務で使える信頼性ある基盤」へと進化している点です。これまでの画像生成AIは、プロンプト次第で結果が大きくブレたり、テキストが崩れたり、複数の画像で同じキャラクターを維持できないといった課題がありました。FLUX.2はこうした実用上のボトルネックを技術的に解決しようとしています。

特に重要なのが「マルチリファレンス機能」です。最大10枚の参照画像から一貫性を保ったまま生成できるため、ECサイトの商品画像バリエーション制作や、ブランドガイドラインに沿った素材作成が格段に効率化されます。従来は人手で調整していた作業が、AI側で自動的に整合性を取れるようになるわけです。

技術面では、320億パラメータという大規模なモデルサイズが特徴的です。このスケールにより、複雑な指示文への追従性や、光源・材質といった物理的な整合性が大幅に向上しています。

コスト面での競争力も見逃せません。Google Gemini 3 Pro Image Preview(通称Nano Banana Pro)と比較すると、同解像度で約4分の1のコストで利用できます。高解像度になるほど差は開き、4K出力では約8分の1という試算です。企業が大量の画像素材を必要とする場合、この価格差は年間数百万円規模の削減につながる可能性があります。

Apache 2.0ライセンスで公開されるVAE(変分オートエンコーダー)の意義も大きいです。これは画像を圧縮・復元する中核技術で、オープン化されることで企業は自社環境に組み込みやすくなります。特定ベンダーへの依存を避けつつ、商用利用も自由に行えるため、長期的な技術投資として安心感があります。

一方で、リアルな画像やテキストを高精度で生成できるということは、偽情報や悪用のリスクも高まることを意味します。Black Forest Labsは厳格な利用規約を設けていますが、技術が広く普及すればするほど、コンテンツの真正性を検証する仕組みや、透かし技術などの対策が不可欠になってくるでしょう。

このリリースは、オープンソースとビジネスの両立という点でも示唆的です。完全オープンではなく「オープンコア戦略」を採用し、無償で使える部分と商用サービスを明確に分けています。持続可能なAI開発のビジネスモデルとして、今後の業界標準になる可能性があります。

【用語解説】

オープンウエイトモデル
AIモデルの学習済みパラメータ(重み)を公開する形態。完全なオープンソースとは異なり、学習コードやデータセットは非公開の場合もある。研究者や開発者が自由に実験できる一方、商用利用には別途ライセンスが必要なケースが多い。

VAE(変分オートエンコーダー)
画像を低次元の潜在空間に圧縮し、再び高解像度に復元する機械学習モデル。画像生成AIでは、この圧縮表現を操作することで効率的な生成・編集を実現する。FLUX.2では4メガピクセルの高品質な復元を可能にする中核技術となっている。

ELOスコア
もともとチェスの実力評価に使われていた指標で、AI分野では複数モデルを対戦形式で比較評価する際に用いられる。スコアが高いほど他モデルとの比較で優れた結果を出したことを示す。

Apache 2.0ライセンス
商用利用・改変・再配布が自由に認められるオープンソースライセンス。企業が安心して製品に組み込める寛容なライセンスとして広く採用されている。

レイテンシー
システムが要求を受けてから応答するまでの遅延時間。画像生成AIでは、プロンプト入力から画像出力までの待ち時間を指す。業務利用では予測可能な低レイテンシーが重要となる。

マルチリファレンスコンディショニング
複数の参照画像を条件として与え、それらの特徴を維持しながら新しい画像を生成する技術。FLUX.2では最大10枚までの参照画像を同時に処理できる。キャラクターの一貫性や商品の詳細を保ったまま、異なるシーンやアングルの画像を作成できる。

【参考リンク】

Black Forest Labs 公式サイト(外部)
Stable Diffusion開発者が創業したドイツのAIスタートアップ。FLUX.2を含む画像生成モデルの開発・提供を行う。

FLUX.2 公式ブログ(外部)
FLUX.2の技術詳細、モデルバリアント、ベンチマーク結果を掲載。各モデルの性能比較やアーキテクチャ解説が含まれる。

FLUX API Pricing(外部)
FLUX.2の料金計算機を提供。メガピクセル単位での課金体系や、解像度別の具体的なコストをシミュレーション可能。

Andreessen Horowitz (a16z)(外部)
Black Forest Labsへ3100万ドルのシード資金を主導したベンチャーキャピタル。AI・Web3分野へ積極投資する米国大手VC。

NVIDIA Developer Blog – FLUX.2(外部)
NVIDIAとの協業で実現したfp8最適化実装について解説。ComfyUIでのローカル実行に関する技術情報を提供。

【参考記事】

FLUX.2の概要|npaka(外部)
日本語でFLUX.2の5つのモデルバリアント、ベンチマーク性能、技術的特徴を詳細に解説。図表付きで整理された技術記事。

Black Forest Labs、画像生成AIの最新モデル「FLUX.2」を発表 – ZDNet Japan(外部)
FLUX.2の発表を日本語で報じた速報記事。マルチリファレンス機能や4メガピクセル対応、オープンコア戦略を概説。

新画像生成AI「FLUX.2」が登場! オープンモデルで4メガピクセル対応 – 窓の杜(外部)
FLUX.2の実用性に焦点を当てた日本語解説。4メガピクセル編集機能やテキスト生成精度の向上について詳述。

Finally, image generation AI ‘FLUX.2’ has arrived – GIGAZINE(外部)
FLUX.2のリリース内容と技術的進化を包括的にカバー。ベンチマーク結果や競合比較、価格面での優位性を具体的数値で提示。

【編集部後記】

日々の暮らしやお仕事の現場に、AI画像生成の波は確かに押し寄せています。みなさんは「人手では不可能」と感じていたクリエイティブ作業や、表現の広がりにワクワクする瞬間はありますか?AIの進化でどんなアイデアが生まれるのか、ご自身の現場に当てはめて考えてみてはいかがでしょうか。今だからこそ、未来の可能性について一緒に探っていけたら嬉しいです。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です