LoRA学習用の画像に自動でタグ(キャプション)付けする方法

LoRA学習 自動タグ付けツール&作成方法

Gradio(グラディオ)をベースにしたUI、たとえば 「Kohya_ss」 や 「sd-scripts」のGradio版」 などには、LoRA学習用の画像タグ付け(captioning)機能が含まれています。
これを使えば、LoRA学習用の画像に対して自動でタグ(キャプション)を付けることができます。

具体的には、以下のようなことが可能です。

Gradio UIでのタグ付け(キャプション生成)機能

機能説明
BLIP captioning画像を解析し、自然言語で簡単な説明文(キャプション)を自動生成します。英語で出力されます。
DeepDanbooru taggingアニメ系画像に特化したタグ付け機能。Danbooruスタイルのタグ(1girl, long_hair, smileなど)を自動生成します。LoRA学習向きです。
カスタム修正タグの一括削除・編集や、特定のタグだけ残すこともできます。

よく使われるGradioベースのLoRAツール例

  • Kohya_ss GUI版(Gradio WebUI)
    Utilitiesタブに「BLIP captioning」「DeepDanbooru」などの自動タグ付けツールあり。
  • sd-scripts + Gradio拡張
    tools/caption_gui.py などでローカルGradioサーバーを起動してタグ付け作業が可能。
目次

キャプション機能の比較表

項目TagGUI(Tag Autocaption系)Kohya_ss 内蔵キャプション
主な用途画像から自動タグ抽出(Danbooru系タグベース)LoRAやDreamBooth学習用にキャプション整備
インターフェースGUI(ブラウザ操作型、Gradioベースが多い)CLI または GUI(学習時の前処理に利用)
キャプション生成方法事前学習済みモデル(DeepDanbooru、WD14 tagger など)で自動生成ユーザー指定の正規表現・ルールや自動タグ付け拡張で生成
精度・傾向アニメ・イラストに強く、タグ形式(例: 1girl, blue hair)より汎用的だが、基本は「補助機能」。単体では精度低め
カスタマイズ性– 不要タグのフィルタリング
  • 頻度しきい値設定
  • 出力形式変更可能 | – 正規表現で文字列処理
  • caption_dropout / shuffle など学習向け調整機能 |
    | 出力形式 | comma, separated, tags(学習データに適した形式) | .txt ファイルに文章形式またはタグ列 |
    | 得意分野 | 画像 → タグ化の自動化 | 学習データに最適化されたキャプション作成 |
    | 人気度(2025年現在) | キャプション専用としてよく使われる(WD14併用が主流) | 学習セット準備では必須級だが、キャプション生成はTagGUI併用が多い |
    | 導入のしやすさ | 簡単(Gradio UIでドラッグ&ドロップ) | Kohya_ss環境必須、設定に慣れが必要 |
    | おすすめの使い分け | 元画像のタグ付け・一括処理 | 最終調整や正規表現でのクリーニング |
  • TagGUI(WD14含む) → 自動タグ生成に強い(特にアニメ・イラスト向け)
  • Kohya_ss → 学習用のキャプション整形・調整に強い

つまり 「TagGUIでキャプションを作成 → Kohya_ssで調整」 が実務で最も多い流れです。

使い方の簡単な流れ(Kohya_ss Gradio UIの場合)

  1. WebUIを起動
  2. Utilities タブへ移動
  3. Preprocess images → 画像フォルダを指定
  4. Captioning methodBLIPDeepDanbooru を選択
  5. 実行すると、同じフォルダ内に .txt ファイルでキャプションが保存される

基本的には 事前に学習済みモデルをダウンロードして配置しておく必要があります

Kohya_ss GUI で DeepBooru を使う場合の流れ

STEP
モデルの入手
  • 公式または信頼できる配布先から学習済み DeepBooru モデル(例:deepbooru-v3)をダウンロード
  • .pth.ckpt ファイル形式が多いです
STEP
モデルの配置
  • Kohya_ss の repositories フォルダ内、または dataset/tagger/models フォルダなど、GUI で指定できる場所に配置
  • GUI から「モデル選択」で、このフォルダ内の学習済みモデルを選ぶことができます
STEP
タグ付け
  • モデルを選択した状態で「Tagging」や「Annotate Dataset」を実行すると、各画像に対して自動的にタグが生成されます
あわせて読みたい
【自作イラストをLoRA化】画像とテキストタグ(キャプション)「学習用データセット」の準備からフォル... LoRA(Low-Rank Adaptation)は、既存のAIモデルに対して、自分のイラストや作風を学習させられる技術です。でもいざ始めようとすると── 「どの画像を選べばいいのか?...
  • URLをコピーしました!
目次