【画像編集】ComfyUIで簡単差分生成|Qwen-Image-Edit-Rapid-AIOの使い方

Qwen-Image-Edit-Rapid-AIOでの差分作成

Qwen-Image-Editはさまざまな用途で使う事が出来るモデルです。

具体的には、

  • 荒い画質を高画質に書きなおしたい時
  • 線画化や写実化、キャラ化など画風を変えたい時
  • キャラクターのポーズを変える差分生成

などで、使い方はアイデア次第です。

今回の記事では、Qwen-ImageのAIOを使用して簡単に差分を作成する方法について解説しています。

Qwen-Image-Edit-Rapid-AIOの画像編集モデルを使用して、画像を高画質化する方法についてはこちらで書いています。

目次

Qwenの特徴

Qwenってどんなモデル?
同じキャラのバリエーション生成も簡単です

Qwen-Imageは、Stable Diffusion系のモデルと比べると
全体的に「柔らかい空気感」で、

質感や階調が豊かな点が特徴です。

そして、今回のQwen-Image-Edit-Rapid-AIOは、Qwen-Image-Edit をAIO(All In One)化した統合チェックポイントで

導入のハードルが低いのが特徴です。

Qwen Image EditのNSFWへの対応は?

Qwen Image Editは主に画像編集用途に利用されており、環境によってはコンテンツフィルタが適用される場合があります。
FLUX. Devのようなローカル運用モデルと比較すると、**NSFW用途では期待した結果にならないことがあります。

**NSFW = Not Safe For Work(成人向け性的、性的表現を含む、職場で開くと困る可能性があるコンテンツ全般を指します。)

Qwen Image Edit 系の種類

Qwen Image Edit 系は画像編集ができる拡散モデルで、既存画像を直したいという用途に向いています。z

Qwen テンプレート

ComfyUIのテンプレートでは、以下のモデルの三種類のどれかが使われています

Qwen Image Edit 系の種類
  • Qwen Image Edit
  • Qwen Image Edit Rapid
  • Qwen Image Edit Rapid AIO

すべて「画像編集」ですが、それぞれに特徴があるので、まとめました。

① Qwen Image Edit(無印 / base)

精度重視モデル

※本体モデル以外の、

VAE
CLIP
LoRA(複数)
Accelerator

などを別で用意する必要がある。

性格

  • 指示理解が強い
  • 編集は割と大雑把
  • 再生成寄り

向いてる

  • 雰囲気変更
  • 大きな服装変更
  • 背景差し替え

向いてない

  • 細かい保持
  • 顔の完全一致

「再解釈再生成」

最近、人気の一枚絵からの多角度生成などもこのモデルに、Qwen-Edit-2509-multiple-anglesなどのLoRAモデルを組み合わせている。


② Qwen Image Edit Rapid

高速版(軽量・推論短縮)

※今回の記事で書いているQwen Image Edit Rapid AIOに含まれている、本体モデル以外の、

VAE
CLIP
LoRA(複数)
Accelerator

などを別で用意する必要がある。軽量で推論短縮だが、多少の知識が必要。

性格

  • ステップ少なめ
  • 編集が速い
  • 保持力がやや強い

向いてる

  • 軽い修正
  • 表情変更
  • 微調整

向いてない

  • 大改造
  • 厳密一致

「軽再構成軽編集寄り」


③ Qwen Image Edit Rapid AIO※今回のモデル

AIO(All-In-One)の特徴は、
通常のQwen Editでは、

  • 本体モデル
  • VAE
  • CLIP
  • LoRA(複数)
  • Accelerator

すべてバラバラで管理&接続が必要なところを、ひとつにまとめたモデル。
モデル本体が最初から高速設計で、All-In-Oneの29GBと大きめですがお手軽な点がおすすめです。

性格

  • 統合モデル
  • プロンプト忠実
  • 一貫性重視

向いてる

  • キャラの整形
  • 最終ブラッシュアップ
  • 見栄え改善

向いてない

  • 機械的編集
  • 線の保持

「再構築+安定」


ComfyUIでの生成手順

STEP
ComfyUIを開く
Qwen-Image-Edit-Rapid-AIO解説】

Runpod(レンタルGPU)を使用して今すぐ使いたい方はこちらをご利用下さい!

Qwen-Image-Edit-Rapid-AIOにおすすめのGPUと詳細な手順、設定、ポイントなどをnoteでまとめました。
Runpod(レンタルGPU)を使用してComfyUIでQwenを簡単に使用する方法を、動画、ワークフロー付きで書いています。

ローカルPCにComfyUIのインストールをして始める方はこちらをご覧ください。

Qwen-Image-Edit-Rapid-AIO で必要なVRAM

Qwen-Image-Edit-Rapid-AIOは、VAE・Qwenテキストエンコーダ・Lightning LoRAを1ファイルにまとめたAll-in-One型モデルです。通常のFluxなどと比べてセットアップが楽な反面、バージョンによってVRAM要件が変化しているので注意して下さい。

バージョン別・形式別のVRAM目安

バージョン / 形式必要VRAM目安実用ライン備考
v5以前(旧世代)6〜8GB8GB軽いが今はほぼ使われない
v9〜v15(通常)10〜12GB12GBまだ軽量寄り・精度は控えめ
v16〜v18(通常)12〜16GB16GB推奨現役主力(v18)安定・品質バランス良い
v19〜v23(通常)14〜20GB16〜24GB指示追従・変化量UP、やや重い
Rapid AIO(FP16系)16〜24GB16GBでギリ / 24GB快適全部入りで最も実用的
FP8版(最適化)12〜16GB12GB可速度・VRAM効率良、品質も十分
GGUF(Q4 / Q5)6〜10GB8GB前後軽量だがEdit精度は少し低下(?)
フルFP16(非圧縮)20〜28GB24GB以上研究・最高品質向け

GPU別の最新動作目安(2026版)

GPUVRAM最新評価実用コメント
GTX 10xx / RTX 20xx8〜11GB非推奨動く例はあるが遅い。QwenはRTX 30以降が現実的
RTX 306012GB最低実用ラインv18 / v19 FP8・GGUFが現実運用可能。1024px差分向け (Hugging Face)
RTX 40608GB 軽量向けGGUF Q3〜Q4なら可。FP8はRAMオフロード前提 (Reddit)
RTX 4060 Ti16GBコスパ最強Rapid AIO / FP8 / Q5 GGUFが快適。今いちばんおすすめ
RTX 4070 / 4070 Ti12〜16GB快適Q4〜Q5 GGUF最適。1328pxでも安定しやすい (Qwen Image)
RTX 4080 / 508016GB高速快適FP8・Rapid AIOを高解像度で回しやすい
RTX 4090 / 509024〜32GB最上位Q8 / フルFP16 / multi-image / 動画前差分量産向け最強 (Qwen Image)
Runpodでの使用

生成が安定しない場合は、Runpod(クラウドGPU)でRTX 5090やRTX4090を時間レンタルするのが最も確実な解決策です。
※Runpodで使用する場合はComfyUIインストールや、面倒な環境構築は不要です。
ComfyUIのテンプレートを使用して数クリックで使用できます。

ストレージの注意点

フルバージョンは約60GBのストレージが必要です。量子化FP8版なら約30GB・VRAM 6GB以上・RAM 32GBで動作するため、ローカル環境ではFP8版かGGUF版の選択がおすすめです

STEP
Qwen-Image-Edit-Rapid-AIOのダウンロード

Qwen-Image-Edit-Rapid-AIOは「ダウンロードする必要があります」

モデル本体(必須)

まず モデルファイルをダウンロードします。

例(よく使われるもの)

このモデルは

ComfyUI/models/checkpoints

に入れます。

※2026,04.06に、上記内容に記載ミスを見つけ、訂正いたしました。

訂正箇所
× ComfyUI/models/DiffusionModels
〇 ComfyUI/models/checkpoints

STEP
workflow.jsonを読み込む

ワークフロー(JSON)

次に必要なのが

workflow(ノード構成)

Qwen-Rapid-AIO.json

これは

ComfyUIにドラッグ

で読み込みます。

STEP
生成
  1. 元画像を Load Imageに入れる
  2. 1024〜2048px にリサイズ
  3. Qwen-Rapid-AIO で I2Iで生成する
  4. Denoise:0.60〜0.75(i2i変換時)

「キャラを維持しつつ維持しつつ、ポーズだけ変える」場合の基本設定

CFG: 1.2
Steps: 5
Sampler: euler_ancestral
Scheduler: normal(またはkarras)
Denoise: 0.60〜0.75(i2i変換時)

動画解説付き記事

詳細な設定と、設定のポイントなどをまとめた、”動画付き解説記事はnoteにて販売しています

最適設定に調整済みのオリジナル”ワークフローテンプレート付きで最短で環境構築できます。

高解像度化したキャラクターから簡単に多角度を生成する方法

多角度生成

Qwen-Edit-2509-multiple-anglesを使用すれば、高解像度化したキャラクターから簡単に多角度を生成する事が出来ます。

キャラクターを3D化

8方向画像を生成してくれるマルチアングルモデル

画質は多少落ちるので、生成後に再度”Qwen-Image”で書きなおしたい。

Qwenで画質にノイズが載る場合の改善策

Qwenで髪の毛にノイズが載る場合の改善方法に関して、こちらの記事で書きました。

よかったらシェアしてね!
  • URLをコピーしました!
目次