【GFPGANのインストール方法と使い方】と【Automatic1111で使用する方法】

GFPGANの インストール方法

GFPGANとは?

GFPGAN(Generative Facial Prior GAN)は、顔画像に特化した、顔復元のためのツールです。
リアルな仕上がりで古い写真の再生に最適なツールです。
顔以外の修復にはReal-ESRGANを併用して行います。
今回は、GFPGANのインストール方法使用方法について、解説します。

目次

用途と特長

用途顔画像の修復・補完
特徴

  • 古い写真や低解像度の顔画像を高精度に修復
  • 目、口、鼻などの顔の特徴を自然に再現
  • 顔に特化した補完に優れており、ポートレートの復元向き
  • :ぼやけた顔写真の鮮明化、ダメージ修復

GFPGANは画像補完に特化し、コマンドプロンプトでスムーズに動きます。

その他のAI画像補完ツールについてはコチラのページで紹介しています。

GFPGAN が組み込める / 使える主なツール・環境

GFPGANは主に、様々なツールに組み込んで使用します。

1. Python スクリプトに直接組み込み

GFPGAN は PyTorch モデルなので、Python で直接呼び出す事も出来ます。

from gfpgan import GFPGANer
restorer = GFPGANer(model_path='GFPGANv1.4.pth')

▶ 自作アプリ
▶ 顔補正バッチ処理
▶ CLI での一括変換
などが可能です。


2. WebUI / GUI ツール

これらのツールでは“標準で”GFPGAN を内蔵しています。

又、WebUI / GUIツールで使用する場合は、GFPGANと同時に、アップスケール機能なども併用する事が出来、さらなる効果が望めます。
WebUI / GUI ツールを使用してGFPGANを使用する場合は、以下のWebUI / GUI ツールを先にインストールする必要があります。

  • Automatic1111(A1111)
  • ComfyUI
  • Forge
  • Vlad Diffusion
  • EasyPhoto
  • Fooocus(内部で類似補正あり)

▶ StableDiffusion系では最も多く採用されています。

3. 映像系ツールにも組み込み可能

  • FaceFusion(一部でGFPGAN選択あり)
  • DeepFaceLab(補正器として応用可能)
  • 動画リタッチツール(自作)
未来

静止画だけでなく、フレームごとに GFPGAN を適用すれば
動画の顔補正 も可能です。

4. モバイルアプリにも使われている

Real-ESRGANと併用する

GFPGANの他ツールとの併用

GFPGANは、Real-ESRGANと併用することで、写真全体の品質を大幅に向上させることが出来ます。
又、その他CodeFormerなどと組み合わせる事で、さらなる相乗効果と、修復の具合を制御する事が可能です。

Automatic1111の顔修復

スマホ向け AI 補正アプリの多くは
GFPGAN または類似モデルを内部に採用しています。

ただし 公式の GFPGAN v1.4/1.3 をそのまま搭載している例は少ない 様です。

GFPGANとReal-ESRGANの違い

GFPGANReal-ESRGANは、どちらも画像補完・高画質化を行うAIモデルですが、役割と特徴が異なります。以下にそれぞれの違いを簡潔に説明します。

特徴GFPGANReal-ESRGAN
主な用途顔画像の修復・補完画像全体の高解像度化・拡大
強み顔のディテール再現、自然な補完あらゆる画像の高精細化が可能
弱点顔以外の修復は不得意顔の修復精度はGFPGANに劣る
使用シーンポートレート修復、古い写真復元風景、イラスト、テキスト画像拡大

使い分けのポイント

  • 顔中心ならGFPGAN
  • 全体の画質向上ならReal-ESRGAN

GFPGANを使用する方法

GFPGAN公式リポジトリをインストールして実行する方法と、
Stable DiffusionやWebUIで使用する方法があります。
※ここでは、GFPGAN公式リポジトリをインストールする方法とAutomatic1111で使用する方法について書いています。

GFPGAN公式リポジトリをインストールして実行する方法

次の環境で実行できます。

  • Linux(Ubuntu、Xubuntuなど)
  • macOS
  • Windows(WSL:Windows Subsystem for Linuxを使うと便利)
  • Dockerコンテナ(AIツールのセットアップが楽になる)

※Linuxとは?

Windows のターミナルの起動方法…

Windows Terminal起動方法

  1. スタートメニューで、左クリック➡ターミナル もしくは、「Windows Terminal」と検索して起動

※ デフォルトでは PowerShell または WindowsPowerShell)が開きます
画像生成用途の場合は、コマンドプロンプト(CMD)と相性が良いです。
pip install や conda などのモダン開発向けコマンドは、PowerShellと相性が良いです。

(※コマンドプロンプト(cmd)をWindows Terminal から開く為の設定方法はこちらの記事をご覧ください。

Windows Terminalは、タブを切り替えて複数のシェルを使う事が出来ます

  • 上部の ボタンから新しいタブを開けます

※Microsoft 公式も「Windows Terminal」を推奨

Mac のターミナルの起動方法…

ターミナル起動方法

  1. **「Command ⌘ + Space」を押して、「Spotlight検索」**を開く
  2. 検索バーに「ターミナル」と入力してEnter

または、以下の手順でも開けます:

アプリケーションユーティリティターミナル

Linux のターミナルの起動方法…

Linuxターミナル起動方法

  • 1,:Ctrl + Alt + T を同時に押す(多くのLinuxディストリビューションで共通)
  • 2,:アプリケーション一覧から「ターミナル」または「Terminal」で検索して開く

Ubuntu、Fedora、Debianなど、ほとんどのLinux環境に標準で搭載されています。

PowerShell の起動方法…(Windows)

PowerShell(パワーシェル)**は、Windowsに標準搭載されている、より高度な操作ができるコマンドラインツールです。見た目はコマンドプロンプトと似ていますが、より多機能で、プログラミング的な処理も得意です。

PowerShell起動方法

1,スタートメニューで「PowerShell」と検索してクリック

※ コマンドプロンプト(cmd)の起動方法…(Windows)

Windowsキー + Rを押す

cmd」と入力してEnterを押す
または、スタートメニューで「コマンドプロンプト」と検索してもOK!

コマンドプロンプト(cmd)は、Windowsのターミナルからも開く事が出来ます
(※コマンドプロンプト(cmd)をWindows Terminal から開く為の設定方法はこちらの記事をご覧ください。

準備するもの

  • Python環境(Python 3.8以上推奨)画像生成関連は3.10,xがいいです。
  • Git(リポジトリをダウンロードするため)
未インストールの場合は、以下からダウンロード・インストールしてください

PythonGitがインストールされているか確認する方法については、この下で書いています。

セットアップ手順

  1. PythonGitがインストールされているか確認
    コマンドプロンプトで以下を実行し、バージョンが表示されればOK。
python --version
git --version
  1. GFPGANをダウンロード

GitHubからGFPGANのソースをダウンロード

git clone https://github.com/TencentARC/GFPGAN
cd GFPGAN
  1. 必要なパッケージをインストール
pip install -r requirements.txt
  1. モデルファイルをダウンロード
python download.py

画像補完を実行

例えば、input.jpgという画像を補完したい場合は以下を実行。

python inference_gfpgan.py --input input.jpg --output output.png

input.jpgを補完し、output.pngという名前で保存されます。

補完後の画質を向上させたい場合

  • 超解像:Topaz Gigapixel AIやReal-ESRGANを活用
  • ノイズ除去:AIベースのDeNoiseツールを使用
  • 追加補正:Photoshopなどで微調整(最近、Topaz Gigapixel AIもPhotoShopで使用出来るようになりました。)

Real-ESRGANとGFPGANを併用する方法や、Real-ESRGANやGFPGANをGUIで使えるツールなどについては、
こちらの記事で紹介しています。

Automatic1111で使用する方法

準備するもの

  • PC
  • Automatic1111(Automatic1111ではGFPGAN が内蔵されています。)
Automatic1111のインストール方法はこちらの記事で解説しています
STEP
A1111を開きます
webui-user.bat
STEP
Extrasを開きます

上部タブからExtrasを開く

STEP
設定

GFPGAN

現状調整の目安
11 は効果が最大(=強く修復)。柔らかい顔質感を残したい場合は 0.5〜0.8 にすると自然に
GFPGANの設定
1は、効果最大だがえっぎが強調され過ぎてしまう
GFPGANの設定
値の効果は画像の向き不向きが大きい
GFPGANの設定
値を下げると効果が柔らかくなる

Upscale(アップスケール)でReal-ESRGANも併用できる。

STEP
R-ERSGAN などと併用する
Automatoc1111での使用方法
A1111を開き、Extras内で使用
項目調整の目安
Upscaler 1 / 2ここに Real-ESRGAN 系 Soft モデルを入れると、柔らかい肌質を残しつつ解像度を上げられます
Upscaler 2 visibility2つ目のアップスケーラーの効果の強さ。Soft 系を入れた場合は 0.3〜0.5くらいにして微調整
Scale by / Scale to目標サイズの指定方法。Scale to はピクセル数に合わせてリサイズする
Resize4倍にリサイズ。大きすぎると処理が重くなるので必要に応じて 2〜4 倍
Max side length0 は制限なし。必要なら最大辺を設定

画像補完のその他の手段


最後までお読みいただきありがとうございました。今回ご紹介したGFPGANは、顔の補正、特に不鮮明な画像を鮮明にする事に特化したツールですが、他のアプローチで、画像の一部(もしくは、一部を残して)生成する方法を下の記事の中でもご紹介しています。ぜひ一度お試しください。

クラウドGPUを使用して、テンプレート化されたReal-ESRGANやGFPGANを使用する方法もあります、
こちらの記事をご覧ください。

よかったらシェアしてね!
  • URLをコピーしました!
目次