ビジュアル生成 AI モデルを開発している最先端の AI 研究ラボである Black Forest Labs は、最先端の画像生成モデルである FLUX.2 ファミリーをリリースしました。
FLUX.2 には新しいツールや機能が満載です。マルチ リファレンス機能は、フォトリアルなディテールとより鮮明なフォントを含んだ数十枚もの類似した画像のバリエーションを、大規模に生成できます。
NVIDIA は Black Forest Labs および ComfyUI と協力し、モデルの発表に合わせて FP8 量子化と RTX GPU のパフォーマンス最適化を実装しました。これにより、モデルを実行するために必要な VRAM が 40% 削減され、パフォーマンスが 40% 向上しました。
実行に特別なソフトウェア パッケージは必要ありません。モデルは ComfyUI で直接利用できます。
最先端のビジュアル インテリジェンス
FLUX.2 で生成される画像は、大規模な場合でも写真のようにリアルです。現実の照明と物理学に忠実な画像を最大 4 メガピクセルの解像度で再現し、ビジュアルの忠実度を損なう「AI ルック」を排除しています。
これらのモデルには直接的なポーズ コントロールが追加され、画像内の被写体やキャラクターのポーズを直接的に指定できるほか、インフォグラフィックス、ユーザー インターフェイス画面、さらには多言語コンテンツ全体で鮮明で読みやすいテキストが表示されます。さらに、新しいマルチリファレンス機能により、アーティストは参考画像を最大 6 枚まで選択してスタイルや被写体の一貫性を保つことができ、モデル全体のファインチューニングを行う必要がなくなります。

新しい FLUX.2 機能の概要については、Black Forest Labs のブログをご覧ください。
RTX に最適化
新しい FLUX.2 モデルは印象的ですが、非常に高いスペックを要求します。320 億パラメータの驚異的なモデルを利用しているため、完全に読み込むためには 90GB の VRAM が必要になります。アーティストがよく利用する、アクティブなモデルのみを読み込む lowVRAM モードを使用しても、VRAM 要件は依然として 64GB となります。そのため、どのコンシューマー カードでも効果的に使用することはできません。
FLUX.2 モデルをより広い環境で利用できるようにするため、NVIDIA と Black Forest Labs は協力してモデルを FP8 に量子化し、VRAM 要件を 40% 削減しながらも同等の品質を実現しました。

また、GeForce RTX GPU でこのモデルにアクセスできるように、NVIDIA は PC 上でビジュアル生成 AI モデルを実行できる人気のアプリケーションである ComfyUI と提携し、アプリの RAM オフロード機能 (ウェイト ストリーミング) を改善しました。
アップグレードされた機能を使用すると、モデルの一部をシステム メモリにオフロードし、GPU の利用可能なメモリを拡張できます。ただし、システム メモリは GPU メモリよりも低速であるため、パフォーマンスは多少低下します。
NVIDIA はまた、ComfyUI と協力して、FP8 チェックポイントの最適化など、NVIDIA GPU および GeForce RTX GPU 上でのモデルのパフォーマンスを最適化してきました。
今すぐ FLUX.2 を始めましょう。ComfyUI を更新して FLUX.2 テンプレートを確認するか、Black Forest Labs の Hugging Face ページからモデルのウェイトをダウンロードできます。
NVIDIA AI PC については、Facebook、Instagram、TikTok、X で確認できます。また、RTX AI PC ニュースレターを購読すると、最新情報を確実に受け取ることができます。
