LoRA学習用の画像に自動でタグ(キャプション)付けする方法

Gradio(グラディオ)をベースにしたUI、たとえば 「Kohya_ss」 や 「sd-scripts」のGradio版」 などには、LoRA学習用の画像タグ付け(captioning)機能が含まれています。
これを使えば、LoRA学習用の画像に対して自動でタグ(キャプション)を付けることができます。
具体的には、以下のようなことが可能です。
Gradio UIでのタグ付け(キャプション生成)機能
機能 | 説明 |
---|---|
BLIP captioning | 画像を解析し、自然言語で簡単な説明文(キャプション)を自動生成します。英語で出力されます。 |
DeepDanbooru tagging | アニメ系画像に特化したタグ付け機能。Danbooruスタイルのタグ(1girl , long_hair , smile など)を自動生成します。LoRA学習向きです。 |
カスタム修正 | タグの一括削除・編集や、特定のタグだけ残すこともできます。 |
よく使われるGradioベースのLoRAツール例
- Kohya_ss GUI版(Gradio WebUI)
→Utilities
タブに「BLIP captioning」「DeepDanbooru」などの自動タグ付けツールあり。 - sd-scripts + Gradio拡張
→tools/caption_gui.py
などでローカルGradioサーバーを起動してタグ付け作業が可能。
目次
キャプション機能の比較表
項目 | TagGUI(Tag Autocaption系) | Kohya_ss 内蔵キャプション |
---|---|---|
主な用途 | 画像から自動タグ抽出(Danbooru系タグベース) | LoRAやDreamBooth学習用にキャプション整備 |
インターフェース | GUI(ブラウザ操作型、Gradioベースが多い) | CLI または GUI(学習時の前処理に利用) |
キャプション生成方法 | 事前学習済みモデル(DeepDanbooru、WD14 tagger など)で自動生成 | ユーザー指定の正規表現・ルールや自動タグ付け拡張で生成 |
精度・傾向 | アニメ・イラストに強く、タグ形式(例: 1girl, blue hair) | より汎用的だが、基本は「補助機能」。単体では精度低め |
カスタマイズ性 | – 不要タグのフィルタリング |
- 頻度しきい値設定
- 出力形式変更可能 | – 正規表現で文字列処理
- caption_dropout / shuffle など学習向け調整機能 |
| 出力形式 |comma, separated, tags
(学習データに適した形式) |.txt
ファイルに文章形式またはタグ列 |
| 得意分野 | 画像 → タグ化の自動化 | 学習データに最適化されたキャプション作成 |
| 人気度(2025年現在) | キャプション専用としてよく使われる(WD14併用が主流) | 学習セット準備では必須級だが、キャプション生成はTagGUI併用が多い |
| 導入のしやすさ | 簡単(Gradio UIでドラッグ&ドロップ) | Kohya_ss環境必須、設定に慣れが必要 |
| おすすめの使い分け | 元画像のタグ付け・一括処理 | 最終調整や正規表現でのクリーニング |
- TagGUI(WD14含む) → 自動タグ生成に強い(特にアニメ・イラスト向け)
- Kohya_ss → 学習用のキャプション整形・調整に強い
つまり 「TagGUIでキャプションを作成 → Kohya_ssで調整」 が実務で最も多い流れです。
使い方の簡単な流れ(Kohya_ss Gradio UIの場合)
- WebUIを起動
Utilities
タブへ移動Preprocess images
→ 画像フォルダを指定Captioning method
でBLIP
やDeepDanbooru
を選択- 実行すると、同じフォルダ内に
.txt
ファイルでキャプションが保存される
基本的には 事前に学習済みモデルをダウンロードして配置しておく必要があります。
Kohya_ss GUI で DeepBooru を使う場合の流れ
STEP
モデルの入手
- 公式または信頼できる配布先から学習済み DeepBooru モデル(例:
deepbooru-v3
)をダウンロード .pth
や.ckpt
ファイル形式が多いです
STEP
モデルの配置
- Kohya_ss の repositories フォルダ内、または dataset/tagger/models フォルダなど、GUI で指定できる場所に配置
- GUI から「モデル選択」で、このフォルダ内の学習済みモデルを選ぶことができます
STEP
タグ付け
- モデルを選択した状態で「Tagging」や「Annotate Dataset」を実行すると、各画像に対して自動的にタグが生成されます
あわせて読みたい

【自作イラストをLoRA化】画像とテキストタグ(キャプション)「学習用データセット」の準備からフォル... LoRA(Low-Rank Adaptation)は、既存のAIモデルに対して、自分のイラストや作風を学習させられる技術です。でもいざ始めようとすると── 「どの画像を選べばいいのか?...