FLUX.2 [dev]の使い方と検証|RunPod・ComfyUI導入とライセンス・Stable Diffusion比較

Flux.2 特徴、使い方、導入方法まとめ

FLUX.2 [dev]の使い方とライセンス解説【Stable Diffusionとの違い】

画像生成AIの進化は目覚ましく、その中で次世代モデルとして注目されているのが「FLUX.2」です。
特にFLUX.2 [dev]は、写真レベルの画質とプロンプト理解能力を持つ強力なモデルです

この記事では、FLUX.2 [dev]の実力と、重さの問題をどう乗り越えるかを中心に解説します。

この記事でわかる事
  • FLUX.2 [dev]とは何か
  • なぜ重いのか、どう対処するか
  • ライセンスの正しい理解
  • Stable Diffusionとの違い
  • RunPod / ComfyUIでの使い方
  • 実用上の注意点
  • 今回の検証内容と検証結果
未来

今回は、キャラ固定や、差分生成にも活躍しそうなFlux.2の[Dev]です。

目次

FLUX.2とは

FLUX.2はBlack Forest Labsが開発している最新の画像生成モデルで、

FLUX.2シリーズ(Pro / Flex / Dev)は、2025/11/25 に発表されました。

画像編集性能がすごい!
キャラ固定力も高い。(FP16使用)

FLUX.2 基盤ファミリー

proAPI・商用高品質
flex制御系
devローカル向け・本体 ←今回使用しているモデル
klein軽量・高速

FLUX.2 [dev]の特徴

特徴は、

  • 非常に高い画像品質(写真レベルの精度)
  • プロンプトの理解力が高い
  • 構図生成が安定している
  • 複雑な指示にも強い
Flux.2で高画質化

従来のStable Diffusion系モデルと比較して、「調整しなくても最初から完成度が高い」点が大きな違いです。

高精度な生成能力

人物・背景・構図のバランスが非常に良く、破綻が少ないのが特徴です。

テキスト理解力の強さ

プロンプトの細かいニュアンスを反映しやすく、従来モデルよりも指示通りの結果が出やすい傾向があります。

重いが高品質

FLUX.2には複数のバリエーションがありますが、「dev」はモデルサイズが大きく、VRAM消費も多いですが、その分クオリティは非常に高いです。

項目FLUX.1FLUX.2
再現性◎ 高い○〜△ 揺れやすい
表現力
安定性
実験向き

ただしその代償として、モデルサイズが非常に大きく、VRAMを大量に消費します。


正直に言います、このモデルはかなり重いです

必要なGPU環境

FLUX.2は非常に重いため、最低でも以下が推奨されます。

  • VRAM 24GB以上

快適に動く環境

FLUX.2公式 FP16(最高品質・無圧縮→ 約 70GB以上での推奨VRAM

  • RTX 5090
  • A100 / H100クラス
SAKASA

実際、RTX 4090(VRAM 24GB)のテストでも快適とは言えませんでした。

RTX 5090やA100でようやくまともなスピードが出る、という体感でした。VRAM 24GB未満では生成が非常に遅くなるか、そもそもOOMで動きませんでした。

→ ローカルで無理して動かすより、クラウドGPUに逃げるのが現実的な解決策です。

解決策:クラウドGPUのRunPodを使う

ローカルのVRAMが足りない場合、RunPodが最も現実的な選択肢です。

RunPodはGPUサーバーをレンタルするサービスで、ComfyUIがテンプレートとして用意されているため、セットアップの手間も最小限です。ローカルでComfyUIを使っている感覚のまま、クラウドの強力なGPUで動かせます。

RunPodでの基本手順

RunPodは以下の流れで利用できます。

  1. アカウント開設
  2. ComfyUIテンプレートを選択
  3. GPUインスタンスを作成(A100 / 5090など)
  4. FLUX.2モデルをダウンロード
  5. /workspace/models に配置
  6. ComfyUIワークを開いて、ワークフロー読み込み
  7. 生成実行
RunPodについては、こちらをご覧ください。

ライセンス解説

FLUX.2を使う上で注意が必要なのがライセンスです。

モデルの利用

FLUX.2 [dev]は**非商用ライセンス(Non-Commercial)**です。

そのため以下は禁止されています。

  • 商用サービスへの組み込み
  • APIとしての提供
  • SaaS化や収益化目的の利用
  • 企業プロダクションでの利用

つまり「モデルそのものを使ってビジネス展開すること」はできません。

一方で、重要なポイントがあります。

生成画像(出力物)について

FLUX.2で生成された画像(出力物)は、基本的にユーザーに帰属し、利用可能とされています。

未来

どっち?どっち?

SAKASA

・・・って、なるよね。

以下は可能です
  • ブログ・サイトへの掲載
  • SNS投稿
  • 商用デザインへの利用
  • イラスト素材としての使用

つまり、

モデルは非商用だが、生成画像は商用利用可能なのが**非商用ライセンス(Non-Commercial)**です。

項目可否
ローカル生成OK
学習・検証OK
サイト掲載OK
商用デザイン利用OK(出力物)
画像生成サービス化NG
API提供NG

FLUX.2 DevはNSFW画像を生成できますか?

FLUX.2 Devはローカル環境やクラウドGPU上で実行できるため、一般的なオンライン画像生成サービスと比べて制限が少なく、人物イラスト、写真風画像、コスプレ画像、NSFW用途など幅広い用途で利用されています。

Stable Diffusionとの違い

FLUX.2とStable Diffusionは似ているようで、設計思想が大きく異なります。

アーキテクチャの違い

項目FLUX.2Stable Diffusion
基盤Flow TransformerU-Net
設計思想高精度生成特化拡張性重視

FLUX.2は初期生成の時点で完成度が高く、調整なしでも実用レベルの画像が出力されます。
一方Stable Diffusionは、LoRAやプロンプト調整によって仕上げていく設計です。

FLUX.2向き

  • 写実的な画像生成
  • コンセプトアート
  • 商用ビジュアル制作

Stable Diffusion向き

  • LoRA制作
  • カスタムモデル開発
  • 軽量生成ワークフロー

FLUX.2の使い方(RunPod / ComfyUI)

FLUX.2 [dev]は主に以下の環境で利用できます。

ローカル環境

  • ComfyUI / Automatic1111 などのローカルGUIツール
  • Python(diffusersライブラリ経由)
  • Hugging Face上からモデルをダウンロードして使用

クラウドGPU

  • RunPod(GPU クラウド/テンプレートでComfyUIやA1111をワンクリック起動可能)

APIサービス

今回使用した公式ワークフローと、カスタムワークフロー

FLUX.2 Dev公式ComfyUIテンプレートは、Diffusion Modelを、flux2_dev_fp8mixed.safetensors(約33GB)とMistral BF16 Text Encoder(約35.6GB)を組み合わせる構成のため、

モデル一式だけで約70GB近い容量を使用します。カスタムではMistral Text EncoderFP8に落としても検証しました。

基本的な使用方法【ローカルPC/クラウドGPU(Runpod)共通】

step
ComfyUIを開く
step
テンプレート選択画面からFlux.2を絞り込み検索
ComfyUIのFluxテンプレート
step
使用したいFlux.2テンプレートを選択するとワークフロー画面が開きます。

この時、必要なモデルが表示されるか、ワークフロー内で必要モデルを探してダウンロードします。
今回使用したテンプレートでは以下の構成でモデルを使用しました(下の、Model linksを参照してください)。

※ダウンロード方法は■step.1のComfyUIの使い方の記事をご覧ください

Model links

公式ワークフロー

📂 ComfyUI/
├── 📂 models/
│ ├── 📂 text_encoders/
│ │ └── mistral_3_small_flux2_bf16.safetensors
│ ├── 📂 loras/
│ │ └── Flux_2-Turbo-LoRA_comfyui.safetensors
│ ├── 📂 diffusion_models/
│ │ └── flux2_dev_fp8mixed.safetensors
│ └── 📂 vae/
│ └──flux2-vae.safetensors

SAKASA AIでの取り組み

SAKASA AI Runpod One click setup
SAKASA AIでは、AIクリエイターや画像生成ユーザー向けの環境構築ツールやワークフロー支援ツールを開発しています。

Runpod>>> AIツール起動 からモデル配置までをワンクリック環境構築 > 即作業開始

を目的に設計した、Runpodワンクリック環境構築ツールです。
モデル導入にかかる手間を減らし、すぐに制作を始められ、使い捨ても出来る環境構築を目的としています。

カスタムワークフロー

📂 ComfyUI/
├── 📂 models/
│ ├── 📂 text_encoders/
│ │ └── mistral_3_small_flux2_fp8.safetensors
│ ├── 📂 loras/
│ │ └── Flux_2-Turbo-LoRA_comfyui.safetensors
│ ├── 📂 diffusion_models/
│ │ └── flux2_dev_fp8mixed.safetensors
│ └── 📂 vae/
│ └── flux2-vae.safetensors

【検証記録】FLUX.2 Dev 実測データ(2026年6月1日)

mistral_3_small_flux2_bf16.safetensorsと、mistral_3_small_flux2_fp8.safetensorsと、
Turbo mode変更での比較検証を行いました。

検証環境

項目内容
プラットフォームRunpod
ワークフローComfyUI 公式テンプレートとカスタムワークフロー
解像度1024×1024(固定)
ステップ数8(Turbo LoRA使用)

GPU別 生成時間 実測値

画面録画で検証後に生成数回分の平均値で秒数を割り出しています。

GPUVRAM時間備考
L424GB約380秒(6分20秒)Dynamic VRAM発生
RTX PRO 4000 Blackwell24GB約90秒Dynamic VRAM発生
RTX 509032GB約30秒FP8 / Turbo true

設定による速度の違い(RTX 5090)

モデルTurbo mode時間
BF16false約1分30秒
FP8false約1分30秒
FP8true約30秒

結論:RunPodで時短を狙うならどれを選ぶべき?

もしRunPodで「30秒」をさらに縮めたい場合の選択肢は以下のようになります。

最速・効率重視:『H100 SXM』または『H200』

RunPodで「H100」を選ぶ際は、必ず 「SXM」 または 「SXM5」 と書かれているものを選んでください
(※PCIe版だと5090とそこまで速度が変わりません
これらを選ぶと、1024pxの生成時間は約10秒〜15秒前後まで一気に短縮されます。大量にガチャを回したり、何十枚も連続で生成する(動画用など)場合は、圧倒的なタイパを発揮します。

コストとのトレードオフ

もちろん、時間あたりのレンタル費用は跳ね上がります。

  • RTX 5090: 1時間あたり 約 $0.70 〜 $0.99 前後
  • H100 SXM: 1時間あたり 約 $2.50 〜 $3.29 前後

※価格の変更もあります。要確認。(2026年6月時点価格)

おすすめの立ち回り プロンプトの調整やワークフローの構築など、あらかじめ「あーでもないこーでもない」と悩む時間は、レンタル料の安い RTX 5090 でじっくり行い、 ワークフローが完璧に完成して「さあ、ここから一気に100枚〜200枚の本番出力をするぞ!」という段階になったら、ポッドを H100 SXM に切り替えて超高速で一気に出力する、という使い分けがクラウド(RunPod)を最もお得に使いこなす方法です。


わかったこと

① VRAM 24GBでは全滅 FLUX.2 Devは33GB必要。RTX 4090を含む24GBのGPUは全てDynamic VRAM Loadingが発生激遅になる。

② FP8化の効果は速度ではなくVRAM節約 BF16→FP8で速度改善はほぼなし。メリットはダウンロードサイズ削減(35.6GB→18GB)とディスク消費の削減

③Turbo modeがfalseだと8ステップの意味がない ステップ数を8にしてもenable_turbo_modeがfalseのままだと速度改善なし。必ずtrueに設定する。

④ 公式速度データは存在しない Black Forest Labs公式からは速度ベンチマークが一切公開されていない。ネット上の数字は外部サイトの計測か宣伝目的のものが多い。←要注意

※この数値はRunPod環境での実測値です。ローカル環境・他のクラウドサービス・設定の違いにより異なる場合があります。

詳細はこちらで公開予定です。

atelier SAKASA no catch

atelier SAKASA no catch
よかったらシェアしてね!
  • URLをコピーしました!
目次