【ComfyUI】Qwen-Image-Editの髪のノイズを改善する方法

Qwen-Image-Edit_2509_fp8_e4m3fnの髪のノイズを2511 fp8mixedで改善した話
Qwen-Image-Edit-2509 を ComfyUI で使っていると、編集後の画像の髪の毛部分に格子状・縞模様のノイズが発生してしまう事があります。
服や背景の編集をしているだけなのに、指定していない髪の毛にまでノイズが・・・。
ーーー今回は、そんな現象を解決した方法について書いていきたいと思います。
目次
FP8の量子化誤差
使用していたDiffusion Modelは qwen_image_edit_2509_fp8_e4m3fn.safetensors(FP8直接ダウンキャスト版)でした。
FP8は表現できる数値の精度が低く、スケーリングなしで変換すると量子化誤差が発生します。この誤差が髪の毛のような細かいディテール部分に集中して現れ、格子状のノイズとして見えていたようです。
| 形式 | 精度 | VRAMの使用量 | ノイズの出やすさ |
|---|---|---|---|
| FP8(直接) | 低い | 少ない | 出やすい |
| FP8 mixed | 中程度 | ほぼ同じ | 出にくい |
| BF16 | 高い | 多い(40GB+) | ほぼ出ない |
構成(変更前)
- Diffusion Model:
qwen_image_edit_2509_fp8_e4m3fn.safetensors(FP8直接) - LoRA:
Qwen-Image-Edit-2509-Lightning-4steps-V1.0-bf16.safetensors(BF16) - テキストエンコーダー:
qwen_2.5_vl_7b_fp8_scaled.safetensors(スケーリング済みFP8) - VAE:
qwen_image_vae.safetensors - 環境:Runpod / RTX 5090(VRAM 32GB)/ ComfyUI
LoRAはすでにBF16版を使用しており、テキストエンコーダーもスケーリング済みFP8を使用していたため、問題はDiffusion Model側にありました。
解決策:2511 fp8mixed に変更
Comfy-Org の公式リポジトリに fp8mixed版 が存在します。これはセンシティブな層をBF16で保持しつつFP8を使うハイブリッド形式で、VRAMの使用量をほぼ変えずに精度を改善できます。
さらに 2511(新バージョン) のfp8mixed版もあったため、こちらに今回こちらに切り替えました。
あわせて読みたい

split_files/diffusion_models/qwen_image_edit_2511_fp8mixed.safetensors · Comfy-Org/Qwen-Image-Edit_C… We’re on a journey to advance and democratize artificial intelligence through open source and open science.
ダウンロードコマンド(Runpod環境)
wget -O /あなたのパス/ComfyUI/models/diffusion_models/qwen_image_edit_2511_fp8mixed.safetensors \
"https://huggingface.co/Comfy-Org/Qwen-Image-Edit_ComfyUI/resolve/main/split_files/diffusion_models/qwen_image_edit_2511_fp8mixed.safetensors"ComfyUIのUNETLoaderノードで
qwen_image_edit_2511_fp8mixed.safetensors
モデルを選択しなおして生成します。
モデル比較
qwen_image_edit_2511_fp8mixed.safetensorsでは、髪の毛の縞模様・グリッドノイズが改善されました。
Qwenは髪の毛のような細かいディテールが苦手な部分もありますが、fp8mixed版に変えることで目立つノイズは大幅に減りました。
まとめ
- FP8直接ダウンキャスト版はノイズが出やすいため、fp8mixed版を使う方が良さそう
- RTX 5090(32GB VRAM)ではBF16版(40GB必要)は使えないが、fp8mixedで十分改善できる
- 2509より2511の方が新しく、同じfp8mixed形式で提供されている
- LoRAはBF16版、テキストエンコーダーはスケーリング済みFP8を使う構成が公式推奨
使用モデル一覧(変更後)
| 種類 | ファイル名 |
|---|---|
| Diffusion Model | qwen_image_edit_2511_fp8mixed.safetensors |
| LoRA | Qwen-Image-Edit-2509-Lightning-4steps-V1.0-bf16.safetensors |
| テキストエンコーダー | qwen_2.5_vl_7b_fp8_scaled.safetensors |
| VAE | qwen_image_vae.safetensors |

