画像生成&学習に使える「クラウド型」「ローカル型」おすすめツール・サービス一覧
【1】ローカル実行型ツール(自分のPCで動かす)
ツール名 | 特徴 | 対応OS | 備考 |
---|---|---|---|
AUTOMATIC1111 WebUI | 最も人気のあるSD GUI。拡張機能が豊富 | Windows / Linux / WSL / Mac(一部機能) VRAM 6GB以上推奨 | 拡張性・情報量が圧倒的 |
ComfyUI | ノードベースの高機能SD GUI。制御性が高い | Windows / Linux / Mac VRAM 6GB〜 | バッチ処理やフロー構築向け |
InvokeAI | モダンでシンプルなSD GUI。Diffusersベース | Windows / Linux / Mac VRAM 4GB〜 | 軽量で初心者向き |
NMKD Stable Diffusion GUI | GUI完結型。Python不要 | Windowsのみ | 超初心者向き、簡易操作 |
Draw Things | Mac/iOS専用GUIアプリ | macOS / iOS | Appleユーザーに最適 |
Fooocus | 自動プロンプト補完など、最小操作で画像生成 | Windows / Linux | SD初心者向けGUI |
必要なPCスペック
Stable Diffusionを快適に使うには、NVIDIAのGPUが必須です。
パーツ | 推奨スペック(最低でもこれくらい) |
---|---|
OS | Windows 10/11、またはLinux |
GPU | NVIDIA GeForce RTX 3060 以上 |
VRAM | 最低 6GB(8GB以上推奨) |
RAM | 最低 16GB |
ストレージ | 30GB以上の空き容量(モデルDL用) |


【2】クラウド型ツール(GPU付き環境をすぐに使える)
サービス名 | 特徴・用途 | GPU性能 | 無料枠 | 備考 |
---|---|---|---|---|
RunPod | Stable DiffusionやLoRA学習に最適。永続ストレージ&GUI付きテンプレあり。 | A6000,T4, など | なし(従量課金) | コスパよく実運用に最適。環境構築済テンプレが豊富。 |
Google Colab | 学習・画像生成も可能なノートブック環境。入門に最適。 | T4, A100(Pro) | あり(制限あり) | 無料枠は不安定・強制終了あり。Proで安定性UP。 |
Kaggle Notebooks | Google系の無料GPUノートブック。Colabより安定。 | T4など | あり(9時間) | 安定性◎。データ連携には少しコツが要る。 |
Paperspace Gradient | WebUIで操作できるGPUクラウド。テンプレ利用可。 | T4, A100 など | 小規模あり | 安定稼働◎。拡張性・UIも良好。 |
Vast.ai | 世界中の空きGPUを格安レンタル可能。 | 4090, A100など | なし(最安クラス) | 上級者向け。Docker等の知識が必要。 |
Lambda GPU Cloud | 本格GPUレンタル。ディープラーニング特化。 | A100など | なし | 価格高め。商用・研究用に◎。 |
- RunPodやColabで学習をするには、Google Driveやrcloneによるデータ連携がカギです。
- 永続ストレージやリージョン選択はRunPod特有の要素。
- GPU購入と比較した場合、クラウドは「初期コストがゼロ、維持コストで差がつく」形式です。
【3】クラウド型ツール
ツール名 | 特徴 | 無料枠 | 備考 |
---|---|---|---|
Hugging Face Spaces | ブラウザで動くデモ(Gradioベース) | ◎ | 学習・テスト向け |
Replicate | APIベースでSDを提供 | △(課金ベース) | プログラマ向け |
Leonardo.Ai | 商用ライセンス付きGUIサービス | ◯(クレジット制) | 商用利用可能、独自モデルあり |
Mage.space | アカウント不要で使えるSD GUI | ◯(広告表示) | シンプルで使いやすい |
Playground AI | 多機能・画像編集にも対応 | ◯ | 教育・創作向け |
用途別おすすめ早見表
目的 | おすすめサービス |
---|---|
画像生成だけしたい(簡単に) | Leonardo.ai, NightCafe |
無料でGPUを試したい | Kaggle, Colab Free |
安定してLoRA学習したい | RunPod, Paperspace |
ローカル環境で自由にやりたい | Automatic1111, InvokeAI |
超コスパでGPUを借りたい | Vast.ai |
UI付きで画像管理・ノード編集したい | ComfyUI |
【4】プログラム・ライブラリ型(スクリプト/CLI)
※ CLI(コマンドライン・インターフェース)とは、Windows Terminal、PowerShell、CMDなど、キーボードでコマンドを入力して操作するインターフェースの事を指します。対してGUI(Graphical User Interface)は、マウスで操作する画面(ボタン・ウィンドウなど)を指します。
ツール / ライブラリ | 説明 |
---|---|
Stable Diffusion(オリジナル) | CompVis提供の最初のSDコード(Python) |
Diffusers (by Hugging Face) | PyTorchベースの安定&汎用的ライブラリ |
Kohya-ss / LoRA scripts | 学習・微調整に使われるスクリプト一式 |
InvokeAI CLI | GUIなしで使えるInvokeAIバージョン |
① WebUI版(例:AUTOMATIC1111)
特徴
- ブラウザベースのGUI(マウスで操作可能なグラフィカルな画面)
- コードが書けなくても直感的に操作可能
- 拡張機能が豊富(ControlNet, LoRA, Hires.fix など)
- 複数モデルの管理やLoRA、VAEなどを簡単に扱える
AUTOMATIC1111(Stable Diffusion WebUI)は、GUI(Web画面)とCLI(コマンドライン)の両方の側面を持つツールです。
※GUI(Graphical User Interface)とは、マウスで操作する画面(ボタン・ウィンドウなど)を指します。
対して、CLI(コマンドライン・インターフェース)とは、Windows Terminal、PowerShell、CMDなど、キーボードでコマンドを入力して操作するインターフェースの事を指します。
AUTOMATIC1111 の構造と操作の仕組み
要素 | 説明 | ユーザーの操作方法 |
---|---|---|
CLI(コマンドライン) | Pythonやlaunchスクリプトを使ってWebUIを起動する部分 | webui-user.bat や python launch.py を実行 |
GUI(Web UI) | ブラウザで操作するグラフィカルな画面 | ChromeやEdgeで http://127.0.0.1:7860 にアクセス |
起動の流れ
① CLI(例:webui-user.bat)でPython環境が立ち上がる
↓
② Stable Diffusion WebUI用のローカルWebサーバーが起動
↓
③ GUI(http://127.0.0.1:7860)にブラウザでアクセス
↓
④ Web画面上で画像生成などを操作
CLIの役割
AUTOMATIC1111は Webブラウザ上のGUIを表示するサーバー(ローカルWebアプリ)を、Pythonで起動するCLIツール です。
CLIは、以下のような役割を果たしています
- 初回セットアップ(Python仮想環境の作成、依存関係のインストールなど)
- サーバーの起動(FlaskやGradioなどによるWebUIの裏側)
- ログ出力やエラーチェック
- 拡張機能の導入や、パラメータのカスタマイズ(コマンドライン引数)
GUIの役割
実行ファイルでもアプリでもなく、
- 実際の画像生成や操作を、視覚的に使いやすく提供する
- モデル選択、LoRA読み込み、プロンプト入力、生成ボタンなどすべてここで行える
想定ユーザー
初心者〜中級者
GUIで画像生成したい人
詳しいインストール方法は
こちらの記事をご覧ください。

CLIだけで使うことも可能
自動化やバッチ生成スクリプトを書く場合は、GUIを使わずCLIベースで生成することも可能です(例:APIモードや画像生成スクリプトを使う)。
AUTOMATIC1111は、「GUIを使うためにCLIでサーバーを起動する構造」になっており、GUI単体では動作しません。ですが、起動後はCLI操作なしでGUIだけで完結できる設計になっているため、普段使いではGUI中心です。
② Pythonスクリプト版(例:Diffusersなど)
Stable Diffusionを自動化・バッチ生成するCLIベースの方法です。
以下のようなライブラリを使って、Stable Diffusionを コードで制御・自動化 できる方法です。
例:Hugging Face の diffusers
ライブラリ
from diffusers import StableDiffusionPipeline
import torch
pipe = StableDiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5", torch_dtype=torch.float16)
pipe.to("cuda")
prompts = ["A cyberpunk cityscape", "A fantasy castle", "A cute cat in space"]
for i, prompt in enumerate(prompts):
image = pipe(prompt).images[0]
image.save(f"output_{i}.png")
このように、ループや条件分岐を使ってバッチ生成・自動命名・一括保存などが可能です。
他のCLIベースの方法(WebUIをスクリプト操作)
GUIベースの AUTOMATIC1111 WebUI にも「APIモード」があり、次のようにCLIやPythonスクリプトから操作できます。
AUTOMATIC1111 API使用例(Python + requests)
import requests
import json
import base64
payload = {
"prompt": "A beautiful landscape, oil painting",
"steps": 20
}
response = requests.post("http://127.0.0.1:7860/sdapi/v1/txt2img", json=payload)
r = response.json()
image_data = base64.b64decode(r['images'][0].split(",",1)[1])
with open("output.png", "wb") as f:
f.write(image_data)
この方法でも 自動化や大量生成 が可能です。ただし、WebUIをあらかじめ起動しておく必要があります。
特徴
WebUIより軽量・高速なこともある
コードベースのCLI実行
Hugging Faceの diffusers
ライブラリや、オリジナルのCompVis版を使う
より柔軟にカスタマイズ・自動化が可能(バッチ生成、スケジューラ変更など)
想定ユーザー
WebUIを使わず最小限の構成で動かしたい人
Pythonが書ける人、研究用途や自動化したい人
選択の目安
方法 | 用途 | メリット | 注意点 |
---|---|---|---|
diffusers や comfyui スクリプト | 完全自動化、カスタマイズ重視 | 軽量・高速、依存が少ない | 学習コストが高め |
WebUI + API | GUIとの併用、自動化もしたい | 両立しやすい | WebUIの起動が必要 |
WebUI(GUI)単体 | 手動生成、初心者向け | 直感的で簡単 | 自動化には不向き |