画像生成&学習に使える「クラウド型」「ローカル型」おすすめツール・サービス一覧

目次

【1】ローカル実行型ツール(自分のPCで動かす)

ツール名特徴対応OS備考
AUTOMATIC1111 WebUI最も人気のあるSD GUI。拡張機能が豊富Windows / Linux / WSL / Mac(一部機能)
VRAM 6GB以上推奨
拡張性・情報量が圧倒的
ComfyUIノードベースの高機能SD GUI。制御性が高いWindows / Linux / Mac
VRAM 6GB〜
バッチ処理やフロー構築向け
InvokeAIモダンでシンプルなSD GUI。DiffusersベースWindows / Linux / Mac
VRAM 4GB〜
軽量で初心者向き
NMKD Stable Diffusion GUIGUI完結型。Python不要Windowsのみ超初心者向き、簡易操作
Draw ThingsMac/iOS専用GUIアプリmacOS / iOSAppleユーザーに最適
Fooocus自動プロンプト補完など、最小操作で画像生成Windows / LinuxSD初心者向けGUI

必要なPCスペック

Stable Diffusionを快適に使うには、NVIDIAのGPUが必須です。

パーツ推奨スペック(最低でもこれくらい)
OSWindows 10/11、またはLinux
GPUNVIDIA GeForce RTX 3060 以上
VRAM最低 6GB(8GB以上推奨)
RAM最低 16GB
ストレージ30GB以上の空き容量(モデルDL用)

【2】クラウド型ツール(GPU付き環境をすぐに使える)

サービス名特徴・用途GPU性能無料枠備考
RunPodStable DiffusionやLoRA学習に最適。永続ストレージ&GUI付きテンプレあり。A6000,T4, などなし(従量課金)コスパよく実運用に最適。環境構築済テンプレが豊富。
Google Colab学習・画像生成も可能なノートブック環境。入門に最適。T4, A100(Pro)あり(制限あり)無料枠は不安定・強制終了あり。Proで安定性UP。
Kaggle NotebooksGoogle系の無料GPUノートブック。Colabより安定。T4などあり(9時間)安定性◎。データ連携には少しコツが要る。
Paperspace GradientWebUIで操作できるGPUクラウド。テンプレ利用可。T4, A100 など小規模あり安定稼働◎。拡張性・UIも良好。
Vast.ai世界中の空きGPUを格安レンタル可能。4090, A100などなし(最安クラス)上級者向け。Docker等の知識が必要。
Lambda GPU Cloud本格GPUレンタル。ディープラーニング特化。A100などなし価格高め。商用・研究用に◎。
  • RunPodやColabで学習をするには、Google Driveやrcloneによるデータ連携がカギです。
  • 永続ストレージリージョン選択はRunPod特有の要素。
  • GPU購入と比較した場合、クラウドは「初期コストがゼロ、維持コストで差がつく」形式です。

【3】クラウド型ツール

ツール名特徴無料枠備考
Hugging Face Spacesブラウザで動くデモ(Gradioベース)学習・テスト向け
ReplicateAPIベースでSDを提供△(課金ベース)プログラマ向け
Leonardo.Ai商用ライセンス付きGUIサービス◯(クレジット制)商用利用可能、独自モデルあり
Mage.spaceアカウント不要で使えるSD GUI◯(広告表示)シンプルで使いやすい
Playground AI多機能・画像編集にも対応教育・創作向け

用途別おすすめ早見表

目的おすすめサービス
画像生成だけしたい(簡単に)Leonardo.ai, NightCafe
無料でGPUを試したいKaggle, Colab Free
安定してLoRA学習したいRunPod, Paperspace
ローカル環境で自由にやりたいAutomatic1111, InvokeAI
超コスパでGPUを借りたいVast.ai
UI付きで画像管理・ノード編集したいComfyUI

【4】プログラム・ライブラリ型(スクリプト/CLI)

※ CLI(コマンドライン・インターフェース)とは、Windows Terminal、PowerShell、CMDなど、キーボードでコマンドを入力して操作するインターフェースの事を指します。対してGUI(Graphical User Interface)は、マウスで操作する画面(ボタン・ウィンドウなど)を指します。

ツール / ライブラリ説明
Stable Diffusion(オリジナル)CompVis提供の最初のSDコード(Python)
Diffusers (by Hugging Face)PyTorchベースの安定&汎用的ライブラリ
Kohya-ss / LoRA scripts学習・微調整に使われるスクリプト一式
InvokeAI CLIGUIなしで使えるInvokeAIバージョン

① WebUI版(例:AUTOMATIC1111)

特徴

  • ブラウザベースのGUI(マウスで操作可能なグラフィカルな画面)
  • コードが書けなくても直感的に操作可能
  • 拡張機能が豊富(ControlNet, LoRA, Hires.fix など)
  • 複数モデルの管理やLoRA、VAEなどを簡単に扱える

AUTOMATIC1111(Stable Diffusion WebUI)は、GUI(Web画面)CLI(コマンドライン)両方の側面を持つツールです。

GUI(Graphical User Interface)とは、マウスで操作する画面(ボタン・ウィンドウなど)を指します。
対して、CLI(コマンドライン・インターフェース)とは、Windows Terminal、PowerShell、CMDなど、キーボードでコマンドを入力して操作するインターフェースの事を指します。

AUTOMATIC1111 の構造と操作の仕組み

要素説明ユーザーの操作方法
CLI(コマンドライン)Pythonやlaunchスクリプトを使ってWebUIを起動する部分webui-user.batpython launch.py を実行
GUI(Web UI)ブラウザで操作するグラフィカルな画面ChromeやEdgeで http://127.0.0.1:7860 にアクセス

起動の流れ

① CLI(例:webui-user.bat)でPython環境が立ち上がる
    ↓
② Stable Diffusion WebUI用のローカルWebサーバーが起動
    ↓
③ GUI(http://127.0.0.1:7860)にブラウザでアクセス
    ↓
④ Web画面上で画像生成などを操作

CLIの役割

AUTOMATIC1111は Webブラウザ上のGUIを表示するサーバー(ローカルWebアプリ)を、Pythonで起動するCLIツール です。

CLIは、以下のような役割を果たしています

  • 初回セットアップ(Python仮想環境の作成、依存関係のインストールなど)
  • サーバーの起動(FlaskやGradioなどによるWebUIの裏側)
  • ログ出力やエラーチェック
  • 拡張機能の導入や、パラメータのカスタマイズ(コマンドライン引数)

GUIの役割

実行ファイルでもアプリでもなく、

  • 実際の画像生成や操作を、視覚的に使いやすく提供する
  • モデル選択、LoRA読み込み、プロンプト入力、生成ボタンなどすべてここで行える


想定ユーザー
初心者〜中級者
GUIで画像生成したい人

詳しいインストール方法はこちらの記事をご覧ください。

CLIだけで使うことも可能

自動化やバッチ生成スクリプトを書く場合は、GUIを使わずCLIベースで生成することも可能です(例:APIモードや画像生成スクリプトを使う)。

AUTOMATIC1111は、「GUIを使うためにCLIでサーバーを起動する構造」になっており、GUI単体では動作しません。ですが、起動後はCLI操作なしでGUIだけで完結できる設計になっているため、普段使いではGUI中心です。

② Pythonスクリプト版(例:Diffusersなど)

Stable Diffusionを自動化・バッチ生成するCLIベースの方法です。
以下のようなライブラリを使って、Stable Diffusionを コードで制御・自動化 できる方法です。

例:Hugging Face の diffusers ライブラリ

from diffusers import StableDiffusionPipeline
import torch

pipe = StableDiffusionPipeline.from_pretrained("runwayml/stable-diffusion-v1-5", torch_dtype=torch.float16)
pipe.to("cuda")

prompts = ["A cyberpunk cityscape", "A fantasy castle", "A cute cat in space"]

for i, prompt in enumerate(prompts):
    image = pipe(prompt).images[0]
    image.save(f"output_{i}.png")

このように、ループや条件分岐を使ってバッチ生成・自動命名・一括保存などが可能です。

他のCLIベースの方法(WebUIをスクリプト操作)

GUIベースの AUTOMATIC1111 WebUI にも「APIモード」があり、次のようにCLIやPythonスクリプトから操作できます。

AUTOMATIC1111 API使用例(Python + requests)

import requests
import json
import base64

payload = {
    "prompt": "A beautiful landscape, oil painting",
    "steps": 20
}

response = requests.post("http://127.0.0.1:7860/sdapi/v1/txt2img", json=payload)
r = response.json()
image_data = base64.b64decode(r['images'][0].split(",",1)[1])

with open("output.png", "wb") as f:
    f.write(image_data)

この方法でも 自動化や大量生成 が可能です。ただし、WebUIをあらかじめ起動しておく必要があります。

特徴

WebUIより軽量・高速なこともある
コードベースのCLI実行
Hugging Faceの diffusers ライブラリや、オリジナルのCompVis版を使う
より柔軟にカスタマイズ・自動化が可能(バッチ生成、スケジューラ変更など)
想定ユーザー
WebUIを使わず最小限の構成で動かしたい人
Pythonが書ける人、研究用途や自動化したい人

選択の目安

方法用途メリット注意点
diffuserscomfyui スクリプト完全自動化、カスタマイズ重視軽量・高速、依存が少ない学習コストが高め
WebUI + APIGUIとの併用、自動化もしたい両立しやすいWebUIの起動が必要
WebUI(GUI)単体手動生成、初心者向け直感的で簡単自動化には不向き
  • URLをコピーしました!
目次