Stable Diffusion 各モデルの特徴・用途・対応ツール・実行方法【まとめ】

Stable Diffusion 各モデルの特徴・用途・対応ツール
目次

Stable Diffusion 各モデルの特徴・用途・対応ツールまとめ

モデル名主な特徴向いている用途対応ツール例
1.4初期モデル、軽量、学習素材が豊富テスト、学習素材としての微調整AUTOMATIC1111, ComfyUI, Diffusers
1.5安定性が高くカスタムモデルが豊富ファンアート、LoRA学習、NSFW含む創作AUTOMATIC1111, InvokeAI, ComfyUI, Diffusers
2.0新アーキテクチャ、768px対応、CLIP改良パースや構図重視の作品AUTOMATIC1111(拡張)、ComfyUI, Diffusers
2.12.0改良版、プロンプト理解UP高解像度イラスト・広告・同人用途などAUTOMATIC1111, ComfyUI, Diffusers
SDXL 1.01024px標準、高画質・自然な描写写実・プロフェッショナル用途(商用サイト、広告など)ComfyUI推奨、Diffusers、InvokeAI(SDXL対応)、Hugging Face Spaces
SDXL Turbo1〜2ステップで高速生成、ややラフな画質リアルタイム生成、動画・アニメ背景下絵ComfyUI, Diffusers, Hugging Face Spaces
SD 3 MediumSDXL並の表現力+軽量、顔や文字も安定軽量運用したいWebサービス、商用アプリHugging Face Spaces、Diffusers(PyTorch)
SD 3.5 Medium3.5系、軽量&高品質バランスブログ画像生成、スマホ連携アプリ等Hugging Face Spaces、Diffusers(予定)
SD 3.5 Large現行最高精度(文字・構図・顔)高品質が求められるビジネス利用(漫画・出版・広告)Hugging Face Spaces(最適)、PyTorch実装あり(ローカル展開には工夫が必要)

どれを選ぶか迷ったら

ニーズおすすめモデルおすすめツール
軽くて動作が速い1.5 / 3 MediumAUTOMATIC1111, ComfyUI, Spaces
高解像度で美しい画2.1 / SDXLComfyUI, Diffusers
とにかく高精度・商用前提SD 3.5 LargeHugging Face Spaces、PyTorch開発環境
Webベースで簡単に商用利用SDXL, SD3系Hugging Face Spaces

商用利用OKな組み合わせ(2025年5月時点)

Hugging Face Spaces(Webベース)

使いたいSpaceを入力

対象:非エンジニア・商用利用希望のクリエイター

  • ツール:Hugging Face Spaces(Web UI)
  • モデル例
    • stabilityai/stable-diffusion-3.5-medium
    • stabilityai/stable-diffusion-3.5-large
    • stabilityai/stable-diffusion-3-medium
  • ライセンス:Stability AI Community License(年間収益100万ドル未満なら無料商用可)

利点:ブラウザだけで使え、環境構築不要。小規模な商用制作(挿絵・デザイン・漫画制作など)に向く。


AUTOMATIC1111 WebUI + SD 1.5

Automatyic1111 WebUI

対象:ローカルでの安定運用をしたい方向け

  • ツール:AUTOMATIC1111 WebUI(ローカルGUI)
  • モデル例
    • runwayml/stable-diffusion-v1-5
    • 各種LoRA/カスタムモデル(CreativeML Open RAIL-M ライセンス適用のもの)
  • ライセンス:CreativeML Open RAIL-M(基本的に商用利用可)

利点:カスタム性・拡張性が高く、オフラインでも使用可能。軽量で安定。

Diffusers(Python API)+ SDXL

対象:アプリやサービス開発向け(開発者)

  • ツールHugging Face Diffusersライブラリ
  • モデル例
    • stabilityai/stable-diffusion-xl-base-1.0
    • stabilityai/stable-diffusion-xl-refiner-1.0
  • ライセンス:Stability AIのCreativeML系(商用OK)

利点:アプリやWebサービスへの組み込みに強く、商用拡張しやすい。

ComfyUI + SDXL/SD 3 Medium

ComfyUI

対象:ノードベースで柔軟に扱いたい中〜上級者

  • ツール:ComfyUI(ローカル/GPU環境推奨)
  • モデル例
    • stabilityai/stable-diffusion-xl-base-1.0
    • stabilityai/stable-diffusion-3-medium
  • ライセンス
    • SDXL:CreativeML Open RAIL-M(商用可)
    • SD3 Medium:Stability AI Community License(条件付き商用可)

利点:高度な制御やアニメーション生成にも対応可能。

商用利用時の注意点

  • 「商用利用OK」でもモデルのライセンス条件(AUPや制限)は必ず確認すること。
  • LoRAや追加モデルは元モデルと異なるライセンスが設定されていることがあるため注意。
  • 収益規模や用途(例えばNFT用途や性的コンテンツ)は制限対象になる場合あり。
用途使用モデル使用ツール商用条件
ブログや商品画像作成Stable Diffusion 2.1AUTOMATIC1111 / ComfyUI / Hugging Face Spaces✔ CreativeML Open RAIL-M で商用利用OK(帰属表示推奨)
Webサービス用画像自動生成SD 3.5 MediumHugging Face Spaces✔ 年商100万ドル未満は無料で商用OK(Community License)
高品質広告・出版用途SD 3.5 LargeHugging Face Spaces / PyTorch API✔ 年商100万ドル未満は無料(同上)、超える場合は契約必要
高速なリアルタイム生成SDXL TurboComfyUI / Diffusers / Hugging Face Spaces✔ CreativeML Open RAIL-M でOK(非再販前提)
高解像度の写真風イラストSDXL 1.0ComfyUI / Hugging Face Spaces / Diffusers✔ CreativeML Open RAIL-M(帰属表示推奨)

商用利用OKのモデルライセンスまとめ

モデル名ライセンス商用利用可否備考
SD 1.5 / 2.1 / SDXL / TurboCreativeML Open RAIL-M商用利用OK帰属表示あり(例:「Image generated by Stable Diffusion」)
SD 3 Medium / 3.5 Medium / 3.5 LargeStability AI Community License年商100万ドル未満までそれ以上はエンタープライズ契約が必要

商用で安心して使えるツールのポイント

ツール商用に向いている理由
Hugging Face Spacesモデルとライセンスが明記されており安心。再販以外の用途ならほぼそのまま商用OK。
Hugging Face Spacesについて詳しくはこちらの記事をご覧下さい。
ComfyUIノードベースで柔軟、軽量モデルにも対応。ライセンス適用モデルを選べば商用に利用可能。
ComfyUIについて詳しくはこちらの記事ををご覧下さい。
AUTOMATIC1111古いモデル(1.5や2.1)との相性がよく、LoRAやControlNetで強化も可能。AUTOMATIC1111について詳しくはこちらの記事ををご覧下さい。

目的別Stable Diffusion対応ツール

【1】ローカル実行型ツール(高性能GPUを活用)

ツール名特徴対応OS備考
AUTOMATIC1111 WebUI最も人気のあるSD GUI。拡張機能が豊富Windows / Linux / WSL / Mac(一部機能)拡張性・情報量が圧倒的
ComfyUIノードベースの高機能SD GUI。制御性が高いWindows / Linux / Macバッチ処理やフロー構築向け
InvokeAIモダンでシンプルなSD GUI。DiffusersベースWindows / Linux / Mac軽量で初心者向き
NMKD Stable Diffusion GUIGUI完結型。Python不要Windowsのみ超初心者向き、簡易操作
Draw ThingsMac/iOS専用GUIアプリmacOS / iOSAppleユーザーに最適
Fooocus自動プロンプト補完など、最小操作で画像生成Windows / LinuxSD初心者向けGUI

【2】クラウド型ツール(ブラウザで実行)

ツール名特徴無料枠備考
Hugging Face Spacesブラウザで動くデモ(Gradioベース)学習・テスト向け
ReplicateAPIベースでSDを提供△(課金ベース)プログラマ向け
Leonardo.Ai商用ライセンス付きGUIサービス◯(クレジット制)商用利用可能、独自モデルあり
Mage.spaceアカウント不要で使えるSD GUI◯(広告表示)シンプルで使いやすい
Playground AI多機能・画像編集にも対応教育・創作向け
RunPod / Google Colab / KaggleGPUを借りてCLIやWebUIを実行◯(制限あり)SD WebUIを使う人に人気

【3】プログラム・ライブラリ型(スクリプト/CLI)

※ CLI(コマンドライン・インターフェース)とは、Windows Terminal、PowerShell、CMDなど、キーボードでコマンドを入力して操作するインターフェースの事を指します。対してGUI(Graphical User Interface)は、マウスで操作する画面(ボタン・ウィンドウなど)を指します。

ツール / ライブラリ説明
Stable Diffusion(オリジナル)CompVis提供の最初のSDコード(Python)
Diffusers (by Hugging Face)PyTorchベースの安定&汎用的ライブラリ
Kohya-ss / LoRA scripts学習・微調整に使われるスクリプト一式
InvokeAI CLIGUIなしで使えるInvokeAIバージョン

① WebUI版(例:AUTOMATIC1111)

特徴

  • ブラウザベースのGUI(マウスで操作可能なグラフィカルな画面)
  • コードが書けなくても直感的に操作可能
  • 拡張機能が豊富(ControlNet, LoRA, Hires.fix など)
  • 複数モデルの管理やLoRA、VAEなどを簡単に扱える

AUTOMATIC1111(Stable Diffusion WebUI)は、GUI(Web画面)CLI(コマンドライン)両方の側面を持つツールです。

GUI(Graphical User Interface)とは、マウスで操作する画面(ボタン・ウィンドウなど)を指します。
対して、CLI(コマンドライン・インターフェース)とは、Windows Terminal、PowerShell、CMDなど、キーボードでコマンドを入力して操作するインターフェースの事を指します。

AUTOMATIC1111 の構造と操作の仕組み

要素説明ユーザーの操作方法
CLI(コマンドライン)Pythonやlaunchスクリプトを使ってWebUIを起動する部分webui-user.batpython launch.py を実行
GUI(Web UI)ブラウザで操作するグラフィカルな画面ChromeやEdgeで http://127.0.0.1:7860 にアクセス

起動の流れ

① CLI(例:webui-user.bat)でPython環境が立ち上がる
    ↓
② Stable Diffusion WebUI用のローカルWebサーバーが起動
    ↓
③ GUI(http://127.0.0.1:7860)にブラウザでアクセス
    ↓
④ Web画面上で画像生成などを操作

CLIの役割

AUTOMATIC1111は Webブラウザ上のGUIを表示するサーバー(ローカルWebアプリ)を、Pythonで起動するCLIツール です。

CLIは、以下のような役割を果たしています

  • 初回セットアップ(Python仮想環境の作成、依存関係のインストールなど)
  • サーバーの起動(FlaskやGradioなどによるWebUIの裏側)
  • ログ出力やエラーチェック
  • 拡張機能の導入や、パラメータのカスタマイズ(コマンドライン引数)

GUIの役割

実行ファイルでもアプリでもなく、

  • 実際の画像生成や操作を、視覚的に使いやすく提供する
  • モデル選択、LoRA読み込み、プロンプト入力、生成ボタンなどすべてここで行える


想定ユーザー
初心者〜中級者
GUIで画像生成したい人

詳しいインストール方法はこちらの記事をご覧ください。

CLIだけで使うことも可能

自動化やバッチ生成スクリプトを書く場合は、GUIを使わずCLIベースで生成することも可能です(例:APIモードや画像生成スクリプトを使う)。

AUTOMATIC1111は、「GUIを使うためにCLIでサーバーを起動する構造」になっており、GUI単体では動作しません。ですが、起動後はCLI操作なしでGUIだけで完結できる設計になっているため、普段使いではGUI中心です。

② Pythonスクリプト版(例:Diffusersなど)

Stable Diffusionを自動化・バッチ生成するCLIベースの方法です。
以下のようなライブラリを使って、Stable Diffusionを コードで制御・自動化 できる方法です。

例:Hugging Face の diffusers ライブラリ

from diffusers import StableDiffusionPipeline
import torch

pipe = StableDiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5", torch_dtype=torch.float16)
pipe.to("cuda")

prompts = ["A cyberpunk cityscape", "A fantasy castle", "A cute cat in space"]

for i, prompt in enumerate(prompts):
    image = pipe(prompt).images[0]
    image.save(f"output_{i}.png")

このように、ループや条件分岐を使ってバッチ生成・自動命名・一括保存などが可能です。

他のCLIベースの方法(WebUIをスクリプト操作)

GUIベースの AUTOMATIC1111 WebUI にも「APIモード」があり、次のようにCLIやPythonスクリプトから操作できます。

AUTOMATIC1111 API使用例(Python + requests)

import requests
import json
import base64

payload = {
    "prompt": "A beautiful landscape, oil painting",
    "steps": 20
}

response = requests.post("http://127.0.0.1:7860/sdapi/v1/txt2img", json=payload)
r = response.json()
image_data = base64.b64decode(r['images'][0].split(",",1)[1])

with open("output.png", "wb") as f:
    f.write(image_data)

この方法でも 自動化や大量生成 が可能です。ただし、WebUIをあらかじめ起動しておく必要があります。

特徴

WebUIより軽量・高速なこともある
コードベースのCLI実行
Hugging Faceの diffusers ライブラリや、オリジナルのCompVis版を使う
より柔軟にカスタマイズ・自動化が可能(バッチ生成、スケジューラ変更など)
想定ユーザー
WebUIを使わず最小限の構成で動かしたい人
Pythonが書ける人、研究用途や自動化したい人

選択の目安

方法用途メリット注意点
diffuserscomfyui スクリプト完全自動化、カスタマイズ重視軽量・高速、依存が少ない学習コストが高め
WebUI + APIGUIとの併用、自動化もしたい両立しやすいWebUIの起動が必要
WebUI(GUI)単体手動生成、初心者向け直感的で簡単自動化には不向き
  • URLをコピーしました!
目次