GFPGANのインストール方法

GFPGANの インストール方法
目次

GFPGANとは?

GFPGANは、AIの顔修復モデルとして一時期バズりましたが、
**「実物と全然違う顔になる」**というある意味での“炎上”も経験しました。
ネットでは「GFPGANが盛りすぎて詐欺になる」とまで言われ、
開発者が「あくまで元に近づけるための技術であって、美化目的じゃないです!」と
フォーラムで説明したことも話題になりました。

そんなGFPGAN(Generative Facial Prior GAN)は、顔画像に特化した、顔復元のためのツールです。
リアルな仕上がりで古い写真の再生に最適なツールです。
顔以外の修復にはReal-ESRGANを併用して行います。
今回は、コマンドプロンプトで使用する方法について、解説します。

用途顔画像の修復・補完
特徴

  • 古い写真や低解像度の顔画像を高精度に修復
  • 目、口、鼻などの顔の特徴を自然に再現
  • 顔に特化した補完に優れており、ポートレートの復元向き
  • :ぼやけた顔写真の鮮明化、ダメージ修復

GFPGANは画像補完に特化し、コマンドプロンプトでスムーズに動きます。

その他のAI画像補完ツールについてはコチラのページで紹介しています。

Real-ESRGANと併用すると最強!

GFPGANで顔を修復し、Real-ESRGANで全体を高解像度化することで、写真全体の品質を大幅に向上させることが可能です。

使い分けのポイント

  • 顔中心ならGFPGAN
  • 全体の画質向上ならReal-ESRGAN

Real-ESRGANとは?

(Enhanced Super-Resolution GAN)

用途画像全体の高解像度化
特徴:画質の向上

:イラスト、風景写真の高精細化、テキスト画像のクリア化
GPU版PyTorchのインストールを推奨

風景・建物・製品写真など、顔以外も補完可能
低解像度画像を大きく拡大し、ディテールを保持
高速かつ汎用性があり、幅広い画像に対応

GFPGANとReal-ESRGANの違い

GFPGANReal-ESRGANは、どちらも画像補完・高画質化を行うAIモデルですが、役割と特徴が異なります。以下にそれぞれの違いを簡潔に説明します。

特徴GFPGANReal-ESRGAN
主な用途顔画像の修復・補完画像全体の高解像度化・拡大
強み顔のディテール再現、自然な補完あらゆる画像の高精細化が可能
弱点顔以外の修復は不得意顔の修復精度はGFPGANに劣る
使用シーンポートレート修復、古い写真復元風景、イラスト、テキスト画像拡大

GFPGANをコマンドプロンプトで使用する方法

このコードは、次の環境で実行できます。

  • Linux(Ubuntu、Xubuntuなど)
  • macOS
  • Windows(WSL:Windows Subsystem for Linuxを使うと便利)
  • Dockerコンテナ(AIツールのセットアップが楽になる)

※Linuxとは?

ターミナル(Windows Terminal)コマンドプロンプト、PowerShell、の開き方

Windowsの場合は、(※Windows Terminal)を開きます。

Windows Terminal(ウィンドウズターミナルの起動方法…

コマンドの実行は、Windows標準の「Windows Terminal」を使って行います。
(※コマンドプロンプト(cmd)やPowerShellでも同様に動作しますが、Windows Terminalの方が操作しやすくおすすめです。)
コマンドプロンプト(Command Prompt)とは、Windowsに搭載されているテキストベースのインターフェースです。マウス操作ではなく、キーボードからコマンド(指示)を入力することで、パソコンを操作できます。

Windows Terminal起動方法

  1. スタートメニューで、左クリック➡ターミナルを起動もしくは、「Windows Terminal」と検索して起動
  2. デフォルトでは PowerShell または Command Prompt(cmd)(又は、WindowsPowerShell)が開きます

画像生成用途の場合は、Command Prompt コマンドプロンプト(CMD)と相性が良いです。

pip installconda などのモダン開発向けコマンドは、PowerShellと相性が良いです。

※詳しい使用方法や、Windows Terminalの設定方法は、こちらの記事をご覧ください。

Windows Terminalは、タブを切り替えて複数のシェルを使う事が出来ます

  • 上部の ボタンから新しいタブを開けます
  • をクリックすると以下の選択肢があります
    • PowerShell
    • Command Prompt
    • WSL(Linuxサブシステム)※インストール済みなら
    • Azure Cloud Shell(必要な場合)

※Microsoft 公式も「Windows Terminal」を推奨しているため、当サイトでも記載するWindowsのコマンド実行場所を、コマンドプロンプト(cmd)から「Windows Terminal」に変更致しました。

コマンド入力は間違えるとエラーになることもありますが、慣れると素早く作業ができる便利なツールです。

Macの場合は、(※ターミナル)を開きます。

ターミナル(Terminal)の起動方法…

Macにはターミナル(Terminal)というアプリがあり、これを使うことで、コマンドを入力してシステムを操作できます。

ターミナル起動方法

  1. **「Command ⌘ + Space」を押して、「Spotlight検索」**を開く
  2. 検索バーに「ターミナル」と入力してEnter

または、以下の手順でも開けます:

アプリケーションユーティリティターミナル

Linux のターミナルの起動方法…

Linuxでは「ターミナル」が、コマンド操作の基本です。ウィンドウの中でキーボード入力によりシステムを操作します。

Linuxターミナル起動方法

  • 1,:Ctrl + Alt + T を同時に押す(多くのLinuxディストリビューションで共通)
  • 2,:アプリケーション一覧から「ターミナル」または「Terminal」で検索して開く

Ubuntu、Fedora、Debianなど、ほとんどのLinux環境に標準で搭載されています。
Macのターミナルと似た雰囲気で、コマンドの使い方もほぼ共通です。

PowerShell の起動方法…(Windows)

PowerShell(パワーシェル)**は、Windowsに標準搭載されている、より高度な操作ができるコマンドラインツールです。見た目はコマンドプロンプトと似ていますが、より多機能で、プログラミング的な処理も得意です。

PowerShell起動方法

1,スタートメニューで「PowerShell」と検索してクリック

2,Windowsキー + R を押して「powershell」と入力 → Enter

コマンドプロンプトと同様、キーボードからコマンドを入力して操作します。
たとえば Get-ChildItem(=フォルダの中身を見る)など、PowerShell独自のコマンドもありますが、通常のコマンド(例:cdpythonなど)も使えます。

※コマンドプロンプト(cmd)の起動方法…(Windows)

Windowsキー + Rを押す

cmd」と入力してEnterを押す
または、スタートメニューで「コマンドプロンプト」と検索してもOK!

ターミナル(Windows Terminal)を開き、”○○○(ツール名)”と打ち込むと呼び出してくれます。

準備するもの

  • Python環境(Python 3.8以上推奨)※ただし、画像生成関連は3.10,xがいいです。
  • Git(リポジトリをダウンロードするため)

画像生成,音声生成用途のPythonのインストール方法はこちらの記事がおすすめです。

Gitのインストール方法

セットアップ手順

  1. PythonGitがインストールされているか確認
    コマンドプロンプトで以下を実行し、バージョンが表示されればOK。
python --version
git --version

もし未インストールなら、以下からダウンロード・インストールしてください

  1. GFPGANをダウンロード

GitHubからGFPGANのソースをダウンロード

git clone https://github.com/TencentARC/GFPGAN
cd GFPGAN
  1. 必要なパッケージをインストール
pip install -r requirements.txt
  1. モデルファイルをダウンロード
python download.py

画像補完を実行

例えば、input.jpgという画像を補完したい場合は以下を実行。

python inference_gfpgan.py --input input.jpg --output output.png

input.jpgを補完し、output.pngという名前で保存されます。

補完後の画質を向上させたい場合

  • 超解像:Topaz Gigapixel AIやReal-ESRGANを活用
  • ノイズ除去:AIベースのDeNoiseツールを使用
  • 追加補正(Photoshopなどで微調整)

Real-ESRGANとGFPGANを併用する方法や、Real-ESRGANやGFPGANをGUIで使えるツールなどについては、
こちらの記事で紹介しています。

クラウドGPUを使用して、画像生成テンプレート化されたReal-ESRGANやGFPGANを使用する方法については、
こちらの記事をご覧ください。

画像補完のその他の手段


最後までお読みいただきありがとうございました。今回ご紹介したGFPGANは、顔の補正、特に不鮮明な画像を鮮明にする事に特化したツールですが、他のアプローチで、画像の一部(もしくは、一部を残して)生成する方法を下の記事の中でもご紹介しています。ぜひ一度お試しください。

関連する生成AI全般の記事を見る

  • URLをコピーしました!
目次