LoRA学習用の画像に自動でタグ（キャプション）付けする方法

LoRA学習での自動キャプションタグ

Gradio（グラディオ）をベースにしたUI、たとえば「Kohya_ss」や「sd-scripts」のGradio版」などには、LoRA学習用の画像タグ付け（captioning）機能が含まれています。
これを使えば、LoRA学習用の画像に対して自動でタグ（キャプション）を付けることができます。

具体的には、以下のようなことが可能です。

Gradio UIでのタグ付け（キャプション生成）機能

機能	説明
BLIP captioning	画像を解析し、自然言語で簡単な説明文（キャプション）を自動生成します。英語で出力されます。
DeepDanbooru tagging	アニメ系画像に特化したタグ付け機能。Danbooruスタイルのタグ（`1girl`, `long_hair`, `smile`など）を自動生成します。LoRA学習向きです。
カスタム修正	タグの一括削除・編集や、特定のタグだけ残すこともできます。

よく使われるGradioベースのLoRAツール例

Kohya_ss GUI版（Gradio WebUI）
→ Utilitiesタブに「BLIP captioning」「DeepDanbooru」などの自動タグ付けツールあり。
sd-scripts + Gradio拡張
→ tools/caption_gui.py などでローカルGradioサーバーを起動してタグ付け作業が可能。

キャプション機能の比較表

項目	TagGUI（Tag Autocaption系）	Kohya_ss 内蔵キャプション
主な用途	画像から自動タグ抽出（Danbooru系タグベース）	LoRAやDreamBooth学習用にキャプション整備
インターフェース	GUI（ブラウザ操作型、Gradioベースが多い）	CLI または GUI（学習時の前処理に利用）
キャプション生成方法	事前学習済みモデル（DeepDanbooru、WD14 tagger など）で自動生成	ユーザー指定の正規表現・ルールや自動タグ付け拡張で生成
精度・傾向	アニメ・イラストに強く、タグ形式（例: 1girl, blue hair）	より汎用的だが、基本は「補助機能」。単体では精度低め
カスタマイズ性	– 不要タグのフィルタリング

頻度しきい値設定
出力形式変更可能 | – 正規表現で文字列処理
caption_dropout / shuffle など学習向け調整機能 |
| 出力形式 | comma, separated, tags（学習データに適した形式） | .txt ファイルに文章形式またはタグ列 |
| 得意分野 | 画像 → タグ化の自動化 | 学習データに最適化されたキャプション作成 |
| 人気度（2025年現在） | キャプション専用としてよく使われる（WD14併用が主流） | 学習セット準備では必須級だが、キャプション生成はTagGUI併用が多い |
| 導入のしやすさ | 簡単（Gradio UIでドラッグ＆ドロップ） | Kohya_ss環境必須、設定に慣れが必要 |
| おすすめの使い分け | 元画像のタグ付け・一括処理 | 最終調整や正規表現でのクリーニング |

TagGUI（WD14含む） → 自動タグ生成に強い（特にアニメ・イラスト向け）
Kohya_ss → 学習用のキャプション整形・調整に強い

つまり 「TagGUIでキャプションを作成 → Kohya_ssで調整」 が実務で最も多い流れです。

使い方の簡単な流れ（Kohya_ss Gradio UIの場合）

WebUIを起動
Utilities タブへ移動
Preprocess images → 画像フォルダを指定
Captioning method で BLIP や DeepDanbooru を選択
実行すると、同じフォルダ内に .txt ファイルでキャプションが保存される

基本的には 事前に学習済みモデルをダウンロードして配置しておく必要があります。

Kohya_ss GUI で DeepBooru を使う場合の流れ

STEP

モデルの入手

公式または信頼できる配布先から学習済み DeepBooru モデル（例：deepbooru-v3）をダウンロード
.pth や .ckpt ファイル形式が多いです

STEP

モデルの配置

Kohya_ss の repositories フォルダ内、または dataset/tagger/models フォルダなど、GUI で指定できる場所に配置
GUI から「モデル選択」で、このフォルダ内の学習済みモデルを選ぶことができます

STEP

タグ付け

モデルを選択した状態で「Tagging」や「Annotate Dataset」を実行すると、各画像に対して自動的にタグが生成されます

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

LoRA学習用の画像に自動でタグ（キャプション）付けする方法

LoRA学習での自動キャプションタグ

Gradio UIでのタグ付け（キャプション生成）機能

よく使われるGradioベースのLoRAツール例

キャプション機能の比較表

使い方の簡単な流れ（Kohya_ss Gradio UIの場合）

【2025年版】AI画像生成に最適なGPU比較：RTX4060～5090【SD/LoRA/ControlNet対応】