【ComfyUI】Qwen-Image-Editの髪のノイズを改善する方法

Qwen-Image-Edit_2509_fp8_e4m3fnの髪のノイズを2511 fp8mixedで改善した話

Qwen-Image-Edit-2509 を ComfyUI で使っていると、編集後の画像の髪の毛部分に格子状・縞模様のノイズが発生してしまう事があります。

服や背景の編集をしているだけなのに、指定していない髪の毛にまでノイズが・・・。

ーーー今回は、そんな現象を解決した方法について書いていきたいと思います。

FP8の量子化誤差

使用していたDiffusion Modelは qwen_image_edit_2509_fp8_e4m3fn.safetensors（FP8直接ダウンキャスト版）でした。

FP8は表現できる数値の精度が低く、スケーリングなしで変換すると量子化誤差が発生します。この誤差が髪の毛のような細かいディテール部分に集中して現れ、格子状のノイズとして見えていたようです。

形式	精度	VRAMの使用量	ノイズの出やすさ
FP8（直接）	低い	少ない	出やすい
FP8 mixed	中程度	ほぼ同じ	出にくい
BF16	高い	多い（40GB+）	ほぼ出ない

構成（変更前）

Diffusion Model：qwen_image_edit_2509_fp8_e4m3fn.safetensors（FP8直接）
LoRA：Qwen-Image-Edit-2509-Lightning-4steps-V1.0-bf16.safetensors（BF16）
テキストエンコーダー：qwen_2.5_vl_7b_fp8_scaled.safetensors（スケーリング済みFP8）
VAE：qwen_image_vae.safetensors
環境：Runpod / RTX 5090（VRAM 32GB）/ ComfyUI

LoRAはすでにBF16版を使用しており、テキストエンコーダーもスケーリング済みFP8を使用していたため、問題はDiffusion Model側にありました。

解決策：2511 fp8mixed に変更

Comfy-Org の公式リポジトリに fp8mixed版 が存在します。これはセンシティブな層をBF16で保持しつつFP8を使うハイブリッド形式で、VRAMの使用量をほぼ変えずに精度を改善できます。

さらに 2511（新バージョン） のfp8mixed版もあったため、こちらに今回こちらに切り替えました。

ダウンロードコマンド（Runpod環境）

wget -O /あなたのパス/ComfyUI/models/diffusion_models/qwen_image_edit_2511_fp8mixed.safetensors \
  "https://huggingface.co/Comfy-Org/Qwen-Image-Edit_ComfyUI/resolve/main/split_files/diffusion_models/qwen_image_edit_2511_fp8mixed.safetensors"

ComfyUIのUNETLoaderノードで

qwen_image_edit_2511_fp8mixed.safetensors

モデルを選択しなおして生成します。

モデル比較

qwen_image_edit_2511_fp8mixed.safetensorsでは、髪の毛の縞模様・グリッドノイズが改善されました。

Qwenは髪の毛のような細かいディテールが苦手な部分もありますが、fp8mixed版に変えることで目立つノイズは大幅に減りました。

まとめ

FP8直接ダウンキャスト版はノイズが出やすいため、fp8mixed版を使う方が良さそう
RTX 5090（32GB VRAM）ではBF16版（40GB必要）は使えないが、fp8mixedで十分改善できる
2509より2511の方が新しく、同じfp8mixed形式で提供されている
LoRAはBF16版、テキストエンコーダーはスケーリング済みFP8を使う構成が公式推奨

使用モデル一覧（変更後）

種類	ファイル名
Diffusion Model	`qwen_image_edit_2511_fp8mixed.safetensors`
LoRA	`Qwen-Image-Edit-2509-Lightning-4steps-V1.0-bf16.safetensors`
テキストエンコーダー	`qwen_2.5_vl_7b_fp8_scaled.safetensors`
VAE	`qwen_image_vae.safetensors`

よかったらシェアしてね！

URLをコピーしました！