【Fooocusの使い方】ComfyUI・Automatic1111と比較|Fooocus 2.5.3(Stable Diffusion系)を実際に使ってみた感想

「Fooocus(フーカス)」は Webサービス ではなく、ローカルで動かす画像生成ツール です。
今回の最新版2.5.3 では、安定性や速度、アップスケーラーやVAE周りの機能改善が入っています。
”細かい制御はComfyUIに劣る”と言われるFooocusですが、気になっていたので試してみました。
Fooocusは、「プロンプト最小限でも高品質」が売りです。期待せずに臨んだFooocusの画像生成なのですが・・・なんと最高でした!

・・・控えめに言っても、相当良かったので、ご紹介したいと思います。



特に優れていると感じた点は、顔の入れ替え”FaceSwap”の精度と、スピード感です。


※この記事は2025年9月時点の Fooocus v2.5.3 をもとにしています
目次
Fooocusとは?
Fooocusは、Stable Diffusionベースの簡単UIツールです。
「プロンプトを細かく設定するより、直感的に高品質画像を生成したい場合に向いています。Stable Diffusion XL(SDXL)モデルの生成をサクサクこなしてくれます。
FooocusはComfyUIよりシンプルでA1111よりスクロールが少ないので、ComfyUIは難しいけど、簡単にFluxやSDXLを試したいという方にとてもお薦めです。
※今回はGPUは**Runpodで”VRAM48GBのA40”を使用しました。
使い方の選択肢
使用方法は、2択です。
- クラウドGPUで利用
→ RunPodやColab上にインストールして動かす。 - ローカルPCにインストール
→ GitHubから入れて自分のGPUで動かす。
手順
ローカル環境で使用
Fooocus の導入方法
- 公式リポジトリを入手
- GitHub(GitHub lllyasviel/Fooocus)からクローン
- もしくは Release ページから zip をダウンロード
- Python 環境を用意
- Automatic1111 と同じく Python 3.10.x(推奨) と Git を用意
- インストール
git clone https://github.com/lllyasviel/Fooocus.git
- ディレクトリに移動して
pip install -r requirements_versions.txt
で依存関係をセットアップ
- 起動
python entry_with_update.py
- 自動で必要なモデル(SDXLベースなど)をダウンロードしてくれる
チェックポイントモデルやLoRAモデルをHuggingFaceや、Civitaiから直接wgetでダウンロードする方法https://sakasaai.com/huggingface-civitai-dl/
クラウドGPUを使用
( このテンプレートはとても安定しています。何度トライしても開かないテンプレートありますので気をつけてください。)


Runpodの使用方法は こちらの記事で書いています。
Runpodテンプレート内で環境変数を設定して、チェックポイントモデルやLoRAモデルをHuggingFaceや、Civitaiから直接ダウンロードして使用する場合は、以下の記事をご覧ください。
Runpodテンプレート内で環境変数を設定する方法https://sakasaai.com/huggingface-civitai-dl/
チェックポイントモデルやLoRAモデルをHuggingFaceや、CivitaiからRunpodテンプレート内に直接ダウンロードする方法https://sakasaai.com/huggingface-civitai-dl/
FooocusのUI



たのしみだね・・・。


基本の使い方
- Input Image タブを開く
- 「元画像を参考に生成する」モード
- 画像をアップロード
- PNG/JPGなど一般的な形式でOK
- プロンプトを入力
- 例:
side view of the character
やback view
など
- 例:
- Generateボタンをクリック
- EnhanceやAdvancedで設定を微調整することも可能


Input Image 内のサブタブ
- Upscale or Variation
- 元画像をベースに 高解像度化(Upscale) または バリエーション生成(Variation)
- 角度や細部を少し変えたい場合に使える
- Image Prompt
- 元画像を 参照画像としてプロンプトに組み込む
- 「このキャラの雰囲気を残して別角度を作る」といった用途に最適
- Inpaint or Outpaint
- 画像の一部を塗り替える(Inpaint)
- 画像の周囲を拡張して新しい部分を描く(Outpaint)
- 背景拡張やポーズ修正にも使える
- Describe(ディスクリプション)
- 元画像の内容を自動で解析して、文章(プロンプト)に変換する機能
- いわゆる 画像→テキスト
- Enhance(エンハンス)
- 元画像の 品質向上やディテール補完
- 顔修正、シャープ化、色味補正なども含む
Upscale or Variation


画像を拡張 or 変化させるための機能
Disabled
- 何も行わない(標準のまま出力)。
- 特に加工や解像度変更は不要なときに選びます。
Vary (Subtle)


- 元の画像を ほとんど崩さずに微調整。
- 色味や細部の雰囲気をちょっと変えたいときに便利。
- 「同じ構図で別テイク」みたいな感じ。
Vary (Strong)


- 元の画像を大きめに変化させる。
- ポーズや服装、表情などもガラッと変わる場合あり。
- 「別バージョンのアイデアを出したい」時に使うと面白い。
Upscale (1.5x)
- 画像を 1.5倍に拡大して高解像度化。
- 元の絵柄を壊さず、軽く細部を強化する用途。
- バランスが良くて使いやすい。
Upscale (2x)


- 画像を 2倍にアップスケール。
- ディテールがしっかり補われるので「完成形」に近い。
- ただし処理時間はやや長め。
Upscale (Fast 2x)
- 2倍に拡大するが、処理を簡略化して速い。
- ディテール補完は通常の2xより少し甘い。
- 「ざっくり大きくしたいけどスピード重視」というときに便利。
手順
- Input Image → Upscale or Variation タブを開く
- 生成済み画像をアップロード
- プロンプトを微調整(必要に応じて)
- Upscaleボタンを選択
- 画質向上、ディテール補完、顔の修正などが自動で適用される
- オプションで微調整
- 解像度(例:2x, 4x)
- Generateをクリック
- 元画像より高精細になった画像が出力されます
例:
- Upscale or Variation 高すぎると元画像が大きく変わってしまう
- 強さは最初は低めで試すと自然な変化になる
Image Prompt
別角度生成の場合などは、元画像をInput Image → Image Prompt でFlux生成
正面のキャラ → 「side view」とプロンプトで補正
生成された画像を Inpaint or Outpaint にアップロードでさらに補正
Image Prompt での複数画像
- Image Prompt
- メインとなる画像。キャラの顔や雰囲気を引き継ぎたいときに入れる。
- CPDS(Cross Pose/Domain Style)
- 構図やポーズを反映させるための補助画像。
- FaceSwap
- 顔だけ差し替えたいときに使う。
- PyraCanny
- 画像から 輪郭(エッジ)を抽出するツール
PyraCanny


- 役割
- 画像から 輪郭(エッジ)を抽出するツール
- 生成AIに「構造情報(線画のような形)」を渡すことで、構図を正確に保った画像生成ができる
- 特徴
- 通常のCannyエッジ検出より 階層的(Pyramid)に処理 される
- 小さなディテールも保持しつつ、全体構造も捉えやすい
例:
- ControlNetやFluxでの参考画像生成
- 元画像をPyraCannyで変換 → AIに入力
- プロンプト通りの構図やポーズを正確に再現
- 別角度・バリエーション生成の補助
- 参考画像をそのまま使うとディテールが崩れる場合
- PyraCannyで輪郭だけ抽出 → Fluxに渡すと 形を維持しながら生成 可能
CPDS(Cross Pose/Domain Style)


- 役割
- 元画像の ポーズや構図を別画像から抽出して適用
- 「正面のキャラを横向きにしたい」ときに便利
- 使いどころ
- Image Promptで構図用の画像を指定
- CPDSをONにすると、Fluxがその構図を参考に生成する


例:
- 元画像:キャラ正面
- 構図画像:横向きポーズ
- CPDS ON → Fluxが正面キャラを横向きポーズで生成
FaceSwap(フェイススワップ)


プロンプトで、背景と、服を白に指定している。


- 役割
- 元画像の顔だけを別画像の顔に置き換える機能
- 使いどころ
- キャラの表情や顔の向きを変えたいとき
- 背景や服は元画像のまま保持できる
例:
- 元画像:キャラ全体
- 顔画像:表情を変えた別の画像
- FaceSwap ON → 元画像の体に別画像の顔を自然に合成
機能 | 何をするか | 使いどころ |
---|---|---|
CPDS | 他画像のポーズや構図を適用 | 別角度・ポーズ生成 |
FaceSwap | 顔だけ別画像に置き換え | 表情変更やキャラ入れ替え |
Image Prompt | 複数画像参照 | 役割ごとに参照画像を分けて生成 |
Image Prompt内のAdvanced
Image PromptのAdvancedは、複数画像をどのように組み合わせて生成するかの細かい設定 ができる
Inpaint or Outpaint
今回は、以前、こちらの記事 Real-ESRGAN と GFPGANを連携させる方法とGUIで使えるツールで
顔の補正を行った画像で”Inpaint or Outpaint”を用いて、ヘアスタイルと背景を生成していきます。




Inpaint / Outpaint でのマスク指定手順
- Input Image タブ → Inpaint / Outpaint を選択
- ここが部分修正・補完モードです
- 元画像をアップロード
- 修正したい画像(Fluxで生成した画像)を選ぶ
- マスクを作成
- マウスで塗る
- 修正したい部分をブラシで塗ります
- 例えば「前髪」「手」「背景の余白」など
- Fooocusでは塗った部分が 透明部分として扱われ、そこだけAIが書き換える
- 逆に塗らない部分は保持されます
- マウスで塗る
- プロンプトを入力
- 例:
turn character to back view
- マスクした部分だけFluxが新しく生成
- 例:
- Generate ボタンをクリック
- マスク部分だけを置き換えた画像が生成されます


Describe
- 元画像:猫がソファに座っている写真
- Describe実行 → 自動生成プロンプト:「A cute cat sitting on a sofa, soft lighting, realistic style」
- このプロンプトをImage Promptで使用できる
Enhance
- Fluxで生成した画像 → Enhance → より鮮明で自然な仕上がりに
生成後の画像をさらにくっきりさせたいとき - UpscaleやVariationよりも簡単に品質を整えたいとき
Advancedでできること
Setting
Preset
initial
ほぼデフォルトの状態。ベーシックな品質で「安定感」を重視。まずはここから試すのがおすすめ。
anime
アニメ調に最適化されたプリセット。線がくっきりして、二次元っぽい絵柄になりやすい。キャラクター系を作りたい人向け。
default
Fooocus 標準の設定。バランス型で、写実系もイラスト系も扱いやすい。
lcm
Latent Consistency Models を使った高速生成用の設定。品質はやや荒めになるけど、とにかく「速さ重視」。サクサク試したいとき向け。
lightning
さらに速さに特化した超高速プリセット。下描き感覚やアイデア出しのときに便利。完成度よりスピード優先。
Playground-v2.5
PlaygroundAIのモデルを前提とした設定で、鮮やかさやコントラストが強めに出やすい。ポップなイラストや広告風のビジュアルに合う。
プロンプト細分化
- Positive / Negative prompt を別枠で入力可能
- Prompt Strength(プロンプトの強さ)を数値で調整できる
- LoRA の呼び出しもこの欄から行える(例:
<lora:filename:0.8>
)
サンプリング制御
- Sampler の選択(Euler、DPM++、DDIM など)
- ステップ数(デフォルト20〜30程度を調整可能)
- CFG Scale(Classifier Free Guidance)
→ プロンプトの忠実度を数値で調整
サイズ・解像度設定
- 解像度を直接入力(例:1024×1024、768×1344 など自由)
- **Upscale(超解像)**を組み合わせて高解像度出力
- Aspect Ratio(縦長・横長の比率)プリセットもあり
シード値制御
- Seed の固定(同じ結果を再現可能)
- Randomize(ランダム生成)
高度な生成モード
- Img2Img(画像を入力して変換)
- Inpainting(部分修正 / 顔差し替えなど)
- ControlNet相当の機能(ポーズや構図を保持)
バッチ生成
- 複数枚まとめて生成
- 連番ファイル名で保存される
Styleの適用
面白い機能としては、右側のタブにある”Style”があります。
様々なスタイルを適応可能。水墨画風や線画、有名アーティスト風に、折り紙なんてのもある。
Fooocusにおける「Style(スタイル)」
あらかじめプリセット化されたプロンプトのセット で、実際には ポジティブ/ネガティブプロンプトの定型文 が裏で仕込まれている。
ユーザーは細かく書かなくても、その雰囲気に寄せる事が出来る。
Fooocusはスタイルを「木(tree)」のように整理しており、「階層的な分類」のイメージで、1つの大きなカテゴリの下に複数の派生スタイルがぶら下がる形で管理されている。その数公式アップデート毎に増えている(最近は400超え)
複数のスタイルを組み合わせることも可能
→ 例:「Anime + Cinematic」で映画風アニメ。
ただしスタイルによってはお互いに相殺し合う場合もあるので、好みで試行錯誤していく。裏で仕込まれているのは「追加のプロンプト」なので、気になる人は styles
フォルダ内の *.json
を開くと中身を確認できます。





400以上のStyleが用意されているよ!
感想
正直、Fooocusにはあまり期待していませんでしたが、……結果はまったく逆。いい意味で裏切られました。
まず感じたのは 想像以上に高品質 な生成結果。
短いプロンプトでも、自然で完成度の高い画像が出てきます。これは本当に驚きでした。
そして何より、操作の直感さがすごい。
ComfyUIのように自由度はないけれど、あの複雑なノード構築を考えなくても、やりたいことがサクサク進むんです。
さらに、Automatic1111よりもUIの配置が工夫されていて、延々とスクロールすることもなく快適。必要な機能がちゃんと手の届く場所にある感じです。
特に印象的だったのが FaceSwapの精度です。
顔の差し替えがとても自然で、他のツールでありがちな「違和感のある仕上がり」になりません。これはFooocusならではの強みだと思いました。
そして、これからに関して言えば……やっぱり Flux対応への期待 が大きいです。
すでにSDXLでここまで気持ちよく使えるなら、Fluxと組み合わせたときにどんな表現ができるのか、今から楽しみです。
Fooocusは「シンプルなのに妥協がない」ツールでした。