Stable Diffusion 各モデルの特徴・用途・対応ツール・実行方法【まとめ】

Stable Diffusion 各モデルの特徴・用途・対応ツールまとめ
モデル名 | 主な特徴 | 向いている用途 | 対応ツール例 |
---|---|---|---|
1.4 | 初期モデル、軽量、学習素材が豊富 | テスト、学習素材としての微調整 | AUTOMATIC1111, ComfyUI, Diffusers |
1.5 | 安定性が高くカスタムモデルが豊富 | ファンアート、LoRA学習、NSFW含む創作 | AUTOMATIC1111, InvokeAI, ComfyUI, Diffusers |
2.0 | 新アーキテクチャ、768px対応、CLIP改良 | パースや構図重視の作品 | AUTOMATIC1111(拡張)、ComfyUI, Diffusers |
2.1 | 2.0改良版、プロンプト理解UP | 高解像度イラスト・広告・同人用途など | AUTOMATIC1111, ComfyUI, Diffusers |
SDXL 1.0 | 1024px標準、高画質・自然な描写 | 写実・プロフェッショナル用途(商用サイト、広告など) | ComfyUI推奨、Diffusers、InvokeAI(SDXL対応)、Hugging Face Spaces |
SDXL Turbo | 1〜2ステップで高速生成、ややラフな画質 | リアルタイム生成、動画・アニメ背景下絵 | ComfyUI, Diffusers, Hugging Face Spaces |
SD 3 Medium | SDXL並の表現力+軽量、顔や文字も安定 | 軽量運用したいWebサービス、商用アプリ | Hugging Face Spaces、Diffusers(PyTorch) |
SD 3.5 Medium | 3.5系、軽量&高品質バランス | ブログ画像生成、スマホ連携アプリ等 | Hugging Face Spaces、Diffusers(予定) |
SD 3.5 Large | 現行最高精度(文字・構図・顔) | 高品質が求められるビジネス利用(漫画・出版・広告) | Hugging Face Spaces(最適)、PyTorch実装あり(ローカル展開には工夫が必要) |
どれを選ぶか迷ったら
ニーズ | おすすめモデル | おすすめツール |
---|---|---|
軽くて動作が速い | 1.5 / 3 Medium | AUTOMATIC1111, ComfyUI, Spaces |
高解像度で美しい画 | 2.1 / SDXL | ComfyUI, Diffusers |
とにかく高精度・商用前提 | SD 3.5 Large | Hugging Face Spaces、PyTorch開発環境 |
Webベースで簡単に商用利用 | SDXL, SD3系 | Hugging Face Spaces |
商用利用OKな組み合わせ(2025年5月時点)
① Hugging Face Spaces(Webベース)


対象:非エンジニア・商用利用希望のクリエイター
- ツール:Hugging Face Spaces(Web UI)
- モデル例:
stabilityai/stable-diffusion-3.5-medium
stabilityai/stable-diffusion-3.5-large
stabilityai/stable-diffusion-3-medium
- ライセンス:Stability AI Community License(年間収益100万ドル未満なら無料商用可)
利点:ブラウザだけで使え、環境構築不要。小規模な商用制作(挿絵・デザイン・漫画制作など)に向く。


② AUTOMATIC1111 WebUI + SD 1.5


対象:ローカルでの安定運用をしたい方向け
- ツール:AUTOMATIC1111 WebUI(ローカルGUI)
- モデル例:
runwayml/stable-diffusion-v1-5
- 各種LoRA/カスタムモデル(CreativeML Open RAIL-M ライセンス適用のもの)
- ライセンス:CreativeML Open RAIL-M(基本的に商用利用可)
利点:カスタム性・拡張性が高く、オフラインでも使用可能。軽量で安定。


③ Diffusers(Python API)+ SDXL
対象:アプリやサービス開発向け(開発者)
- ツール:Hugging Face Diffusersライブラリ
- モデル例:
stabilityai/stable-diffusion-xl-base-1.0
stabilityai/stable-diffusion-xl-refiner-1.0
- ライセンス:Stability AIのCreativeML系(商用OK)
利点:アプリやWebサービスへの組み込みに強く、商用拡張しやすい。
④ ComfyUI + SDXL/SD 3 Medium


対象:ノードベースで柔軟に扱いたい中〜上級者
- ツール:ComfyUI(ローカル/GPU環境推奨)
- モデル例:
stabilityai/stable-diffusion-xl-base-1.0
stabilityai/stable-diffusion-3-medium
- ライセンス:
- SDXL:CreativeML Open RAIL-M(商用可)
- SD3 Medium:Stability AI Community License(条件付き商用可)
利点:高度な制御やアニメーション生成にも対応可能。


商用利用時の注意点
- 「商用利用OK」でもモデルのライセンス条件(AUPや制限)は必ず確認すること。
- LoRAや追加モデルは元モデルと異なるライセンスが設定されていることがあるため注意。
- 収益規模や用途(例えばNFT用途や性的コンテンツ)は制限対象になる場合あり。
用途 | 使用モデル | 使用ツール | 商用条件 |
---|---|---|---|
ブログや商品画像作成 | Stable Diffusion 2.1 | AUTOMATIC1111 / ComfyUI / Hugging Face Spaces | ✔ CreativeML Open RAIL-M で商用利用OK(帰属表示推奨) |
Webサービス用画像自動生成 | SD 3.5 Medium | Hugging Face Spaces | ✔ 年商100万ドル未満は無料で商用OK(Community License) |
高品質広告・出版用途 | SD 3.5 Large | Hugging Face Spaces / PyTorch API | ✔ 年商100万ドル未満は無料(同上)、超える場合は契約必要 |
高速なリアルタイム生成 | SDXL Turbo | ComfyUI / Diffusers / Hugging Face Spaces | ✔ CreativeML Open RAIL-M でOK(非再販前提) |
高解像度の写真風イラスト | SDXL 1.0 | ComfyUI / Hugging Face Spaces / Diffusers | ✔ CreativeML Open RAIL-M(帰属表示推奨) |
商用利用OKのモデルライセンスまとめ
モデル名 | ライセンス | 商用利用可否 | 備考 |
---|---|---|---|
SD 1.5 / 2.1 / SDXL / Turbo | CreativeML Open RAIL-M | 商用利用OK | 帰属表示あり(例:「Image generated by Stable Diffusion」) |
SD 3 Medium / 3.5 Medium / 3.5 Large | Stability AI Community License | 年商100万ドル未満まで | それ以上はエンタープライズ契約が必要 |
商用で安心して使えるツールのポイント
ツール | 商用に向いている理由 |
---|---|
Hugging Face Spaces | モデルとライセンスが明記されており安心。再販以外の用途ならほぼそのまま商用OK。 Hugging Face Spacesについて詳しくはこちらの記事をご覧下さい。 |
ComfyUI | ノードベースで柔軟、軽量モデルにも対応。ライセンス適用モデルを選べば商用に利用可能。 ComfyUIについて詳しくはこちらの記事ををご覧下さい。 |
AUTOMATIC1111 | 古いモデル(1.5や2.1)との相性がよく、LoRAやControlNetで強化も可能。AUTOMATIC1111について詳しくはこちらの記事ををご覧下さい。 |
目的別Stable Diffusion対応ツール
【1】ローカル実行型ツール(高性能GPUを活用)
ツール名 | 特徴 | 対応OS | 備考 |
---|---|---|---|
AUTOMATIC1111 WebUI | 最も人気のあるSD GUI。拡張機能が豊富 | Windows / Linux / WSL / Mac(一部機能) | 拡張性・情報量が圧倒的 |
ComfyUI | ノードベースの高機能SD GUI。制御性が高い | Windows / Linux / Mac | バッチ処理やフロー構築向け |
InvokeAI | モダンでシンプルなSD GUI。Diffusersベース | Windows / Linux / Mac | 軽量で初心者向き |
NMKD Stable Diffusion GUI | GUI完結型。Python不要 | Windowsのみ | 超初心者向き、簡易操作 |
Draw Things | Mac/iOS専用GUIアプリ | macOS / iOS | Appleユーザーに最適 |
Fooocus | 自動プロンプト補完など、最小操作で画像生成 | Windows / Linux | SD初心者向けGUI |
【2】クラウド型ツール(ブラウザで実行)
ツール名 | 特徴 | 無料枠 | 備考 |
---|---|---|---|
Hugging Face Spaces | ブラウザで動くデモ(Gradioベース) | ◎ | 学習・テスト向け |
Replicate | APIベースでSDを提供 | △(課金ベース) | プログラマ向け |
Leonardo.Ai | 商用ライセンス付きGUIサービス | ◯(クレジット制) | 商用利用可能、独自モデルあり |
Mage.space | アカウント不要で使えるSD GUI | ◯(広告表示) | シンプルで使いやすい |
Playground AI | 多機能・画像編集にも対応 | ◯ | 教育・創作向け |
RunPod / Google Colab / Kaggle | GPUを借りてCLIやWebUIを実行 | ◯(制限あり) | SD WebUIを使う人に人気 |
【3】プログラム・ライブラリ型(スクリプト/CLI)
※ CLI(コマンドライン・インターフェース)とは、Windows Terminal、PowerShell、CMDなど、キーボードでコマンドを入力して操作するインターフェースの事を指します。対してGUI(Graphical User Interface)は、マウスで操作する画面(ボタン・ウィンドウなど)を指します。
ツール / ライブラリ | 説明 |
---|---|
Stable Diffusion(オリジナル) | CompVis提供の最初のSDコード(Python) |
Diffusers (by Hugging Face) | PyTorchベースの安定&汎用的ライブラリ |
Kohya-ss / LoRA scripts | 学習・微調整に使われるスクリプト一式 |
InvokeAI CLI | GUIなしで使えるInvokeAIバージョン |
① WebUI版(例:AUTOMATIC1111)
特徴
- ブラウザベースのGUI(マウスで操作可能なグラフィカルな画面)
- コードが書けなくても直感的に操作可能
- 拡張機能が豊富(ControlNet, LoRA, Hires.fix など)
- 複数モデルの管理やLoRA、VAEなどを簡単に扱える
AUTOMATIC1111(Stable Diffusion WebUI)は、GUI(Web画面)とCLI(コマンドライン)の両方の側面を持つツールです。
※GUI(Graphical User Interface)とは、マウスで操作する画面(ボタン・ウィンドウなど)を指します。
対して、CLI(コマンドライン・インターフェース)とは、Windows Terminal、PowerShell、CMDなど、キーボードでコマンドを入力して操作するインターフェースの事を指します。
AUTOMATIC1111 の構造と操作の仕組み
要素 | 説明 | ユーザーの操作方法 |
---|---|---|
CLI(コマンドライン) | Pythonやlaunchスクリプトを使ってWebUIを起動する部分 | webui-user.bat や python launch.py を実行 |
GUI(Web UI) | ブラウザで操作するグラフィカルな画面 | ChromeやEdgeで http://127.0.0.1:7860 にアクセス |
起動の流れ
① CLI(例:webui-user.bat)でPython環境が立ち上がる
↓
② Stable Diffusion WebUI用のローカルWebサーバーが起動
↓
③ GUI(http://127.0.0.1:7860)にブラウザでアクセス
↓
④ Web画面上で画像生成などを操作
CLIの役割
AUTOMATIC1111は Webブラウザ上のGUIを表示するサーバー(ローカルWebアプリ)を、Pythonで起動するCLIツール です。
CLIは、以下のような役割を果たしています
- 初回セットアップ(Python仮想環境の作成、依存関係のインストールなど)
- サーバーの起動(FlaskやGradioなどによるWebUIの裏側)
- ログ出力やエラーチェック
- 拡張機能の導入や、パラメータのカスタマイズ(コマンドライン引数)
GUIの役割
実行ファイルでもアプリでもなく、
- 実際の画像生成や操作を、視覚的に使いやすく提供する
- モデル選択、LoRA読み込み、プロンプト入力、生成ボタンなどすべてここで行える
想定ユーザー
初心者〜中級者
GUIで画像生成したい人
詳しいインストール方法は
こちらの記事をご覧ください。

CLIだけで使うことも可能
自動化やバッチ生成スクリプトを書く場合は、GUIを使わずCLIベースで生成することも可能です(例:APIモードや画像生成スクリプトを使う)。
AUTOMATIC1111は、「GUIを使うためにCLIでサーバーを起動する構造」になっており、GUI単体では動作しません。ですが、起動後はCLI操作なしでGUIだけで完結できる設計になっているため、普段使いではGUI中心です。
② Pythonスクリプト版(例:Diffusersなど)
Stable Diffusionを自動化・バッチ生成するCLIベースの方法です。
以下のようなライブラリを使って、Stable Diffusionを コードで制御・自動化 できる方法です。
例:Hugging Face の diffusers
ライブラリ
from diffusers import StableDiffusionPipeline
import torch
pipe = StableDiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5", torch_dtype=torch.float16)
pipe.to("cuda")
prompts = ["A cyberpunk cityscape", "A fantasy castle", "A cute cat in space"]
for i, prompt in enumerate(prompts):
image = pipe(prompt).images[0]
image.save(f"output_{i}.png")
このように、ループや条件分岐を使ってバッチ生成・自動命名・一括保存などが可能です。
他のCLIベースの方法(WebUIをスクリプト操作)
GUIベースの AUTOMATIC1111 WebUI にも「APIモード」があり、次のようにCLIやPythonスクリプトから操作できます。
AUTOMATIC1111 API使用例(Python + requests)
import requests
import json
import base64
payload = {
"prompt": "A beautiful landscape, oil painting",
"steps": 20
}
response = requests.post("http://127.0.0.1:7860/sdapi/v1/txt2img", json=payload)
r = response.json()
image_data = base64.b64decode(r['images'][0].split(",",1)[1])
with open("output.png", "wb") as f:
f.write(image_data)
この方法でも 自動化や大量生成 が可能です。ただし、WebUIをあらかじめ起動しておく必要があります。
特徴
WebUIより軽量・高速なこともある
コードベースのCLI実行
Hugging Faceの diffusers
ライブラリや、オリジナルのCompVis版を使う
より柔軟にカスタマイズ・自動化が可能(バッチ生成、スケジューラ変更など)
想定ユーザー
WebUIを使わず最小限の構成で動かしたい人
Pythonが書ける人、研究用途や自動化したい人
選択の目安
方法 | 用途 | メリット | 注意点 |
---|---|---|---|
diffusers や comfyui スクリプト | 完全自動化、カスタマイズ重視 | 軽量・高速、依存が少ない | 学習コストが高め |
WebUI + API | GUIとの併用、自動化もしたい | 両立しやすい | WebUIの起動が必要 |
WebUI(GUI)単体 | 手動生成、初心者向け | 直感的で簡単 | 自動化には不向き |