Real-ESRGAN と GFPGANを連携させる方法とGUIで使えるツール

Real-ESRGAN とGFPGANを連係させる方法とGUIで使えるツール
目次

Real-ESRGANGFPGAN

インストール手順や使い方においても Real-ESRGAN(リアル・イーエスアールガン)と GFPGAN (ジーエフピーガン)はかなり似ています。
両方とも Tencent ARC によって開発されており、基本的な実行構成が似ているからです。

本記事では、ローカルでReal-ESRGAN と GFPGANを連携させる方法(導入までの手順を含む)と、GUIでReal-ESRGAN と GFPGANを使えるツールについて書いています。

※既にCUDAとPyTorchのインストールが終わっていて、モデルファイルのダウンロードもお済の方は、
こちらのリンクからGFPGANとReal-ESRGANを連携させる方法にお進みいただけます。

先ずは、ローカルでReal-ESRGAN と GFPGANを使う方法から見ていきましょう。

ローカルでReal-ESRGAN と GFPGANを使う方法

前提環境

Real-ESRGAN や GFPGAN は PyTorch や特定のバージョンのライブラリに依存しているため、専用の仮想環境を作ることで他のプロジェクトと干渉しません。
その為、CUDA環境の構築が楽で、PyTorch + GPU(CUDA)のセットアップが conda で簡単にできるAnaconda(またはMiniconda)の使用がおすすめです。

比較項目venv(Python標準)Anaconda(またはMiniconda)
環境構築の簡単さ自分でPython・CUDA・PyTorchのバージョン整合をとる必要ありcondaが自動で依存関係を解決
パッケージの管理基本はpip頼り。複雑な依存関係で詰まりやすいconda + pip両方使えて柔軟&強力
CUDAの扱いCUDA Toolkitを手動インストールしてパス設定が必要PyTorch+CUDAをconda install pytorchだけで完結できることが多い
初心者への安心感エラー時の自己解決力が必要失敗しにくい構成。エラーも少ない
仮想環境の切り替えsource venv/bin/activate などconda activate 環境名 で統一

※Anacondaを使用する場合は、CUDAとPyTorchのインストールを個別で行う必要がありません。

ここでは、
1⃣Anacondaをインストールして環境を構築する方法と、
2⃣ CUDAとPyTorchのインストールをして環境を構築する方法

という二通りにの環境構築方法について書いています。

1⃣Anacondaをインストールして環境を構築する方法

Anacondaのインストール

anacondaのインストール①

任意のアカウントでログインします。

anacondaのインストール②

Anacondaの公式ダウンロードページから、お使いのOSに対応したインストーラーをダウンロードできます。

anacondaのインストール③

① Anacondaの準備

インストール手順(Windowsの場合)

  1. ダウンロードしたインストーラー(例: Anaconda3-2024.10-1-Windows-x86_64.exe)をダブルクリックして実行します。
anacondaのインストール④

2. インストーラーが起動したら、「Next」をクリックします。
3. ライセンス契約画面で「I Agree」を選択します。
4. インストールタイプの選択では、「Just Me(推奨)」を選び、「Next」をクリックします。
5. インストール先フォルダを確認し、必要に応じて変更後、「Next」をクリックします。
6. 追加タスクの選択では、特に変更がなければそのまま「Install」をクリックします。
7. インストールが完了したら、「Next」をクリックし、最後に「Finish」をクリックしてインストールを終了します。

インストール後、スタートメニューから「Anaconda Prompt」や「Anaconda Navigator」を起動できます。

※Anaconda Navigator(GUI)からアップデートを求められた場合は、基本的にはそのまま「更新」してOKです。ただし、すでに構築済みの仮想環境内でパッケージを更新する場合は、conda updatepipのバージョン管理に注意が必要です。

インストール確認

Anaconda Promptを開き、以下のコマンドを入力してPythonのバージョンを確認します。
Anaconda Promptは、WindowsでAnacondaをインストールした後、以下の手順で起動できます。

  1. スタートメニューを開く
  2. 「Anaconda Prompt」と検索
  3. アイコンをクリックして起動

※黒いウィンドウが開き、(base) と表示されていれば、Anacondaの「base」環境が有効になっています。
もしくは、Windowsターミナルを開き、
タブから””下矢印をクリックで、Anaconda Promptを選択(Anacondaインストール後に追加されます。)

ターミナル(Windows Terminal)コマンドプロンプト、PowerShell、の開き方

Windowsの場合は、(※Windows Terminal)を開きます。

Windows Terminal(ウィンドウズターミナルの起動方法…

コマンドの実行は、Windows標準の「Windows Terminal」を使って行います。
(※コマンドプロンプト(cmd)やPowerShellでも同様に動作しますが、Windows Terminalの方が操作しやすくおすすめです。)
コマンドプロンプト(Command Prompt)とは、Windowsに搭載されているテキストベースのインターフェースです。マウス操作ではなく、キーボードからコマンド(指示)を入力することで、パソコンを操作できます。

Windows Terminal起動方法

  1. スタートメニューで、左クリック➡ターミナルを起動もしくは、「Windows Terminal」と検索して起動
  2. デフォルトでは PowerShell または Command Prompt(cmd)(又は、WindowsPowerShell)が開きます

画像生成用途の場合は、Command Prompt コマンドプロンプト(CMD)と相性が良いです。

pip installconda などのモダン開発向けコマンドは、PowerShellと相性が良いです。

※詳しい使用方法や、Windows Terminalの設定方法は、こちらの記事をご覧ください。

Windows Terminalは、タブを切り替えて複数のシェルを使う事が出来ます

  • 上部の ボタンから新しいタブを開けます
  • をクリックすると以下の選択肢があります
    • PowerShell
    • Command Prompt
    • WSL(Linuxサブシステム)※インストール済みなら
    • Azure Cloud Shell(必要な場合)

※Microsoft 公式も「Windows Terminal」を推奨しているため、当サイトでも記載するWindowsのコマンド実行場所を、コマンドプロンプト(cmd)から「Windows Terminal」に変更致しました。

コマンド入力は間違えるとエラーになることもありますが、慣れると素早く作業ができる便利なツールです。

Macの場合は、(※ターミナル)を開きます。

ターミナル(Terminal)の起動方法…

Macにはターミナル(Terminal)というアプリがあり、これを使うことで、コマンドを入力してシステムを操作できます。

ターミナル起動方法

  1. **「Command ⌘ + Space」を押して、「Spotlight検索」**を開く
  2. 検索バーに「ターミナル」と入力してEnter

または、以下の手順でも開けます:

アプリケーションユーティリティターミナル

Linux のターミナルの起動方法…

Linuxでは「ターミナル」が、コマンド操作の基本です。ウィンドウの中でキーボード入力によりシステムを操作します。

Linuxターミナル起動方法

  • 1,:Ctrl + Alt + T を同時に押す(多くのLinuxディストリビューションで共通)
  • 2,:アプリケーション一覧から「ターミナル」または「Terminal」で検索して開く

Ubuntu、Fedora、Debianなど、ほとんどのLinux環境に標準で搭載されています。
Macのターミナルと似た雰囲気で、コマンドの使い方もほぼ共通です。

PowerShell の起動方法…(Windows)

PowerShell(パワーシェル)**は、Windowsに標準搭載されている、より高度な操作ができるコマンドラインツールです。見た目はコマンドプロンプトと似ていますが、より多機能で、プログラミング的な処理も得意です。

PowerShell起動方法

1,スタートメニューで「PowerShell」と検索してクリック

2,Windowsキー + R を押して「powershell」と入力 → Enter

コマンドプロンプトと同様、キーボードからコマンドを入力して操作します。
たとえば Get-ChildItem(=フォルダの中身を見る)など、PowerShell独自のコマンドもありますが、通常のコマンド(例:cdpythonなど)も使えます。

※コマンドプロンプト(cmd)の起動方法…(Windows)

Windowsキー + Rを押す

cmd」と入力してEnterを押す
または、スタートメニューで「コマンドプロンプト」と検索してもOK!

ターミナル(Windows Terminal)を開き、”○○○(ツール名)”と打ち込むと呼ぶ出してくれます。

アナコンダプロンプト
python --version

また、Anaconda Navigatorを起動して、GUI上で環境やパッケージの管理ができることを確認してください。

Anaconda Prompt を開いて以下を実行(仮想環境を有効化

conda create -n realesrgan_env python=3.10
conda activate realesrgan_env

※このコマンドを実行する事で、realesrgan 内で仮想環境を使った作業ができる状態になります。
PyTorch(GPU対応)をインストール(※GPUを使う場合。CPU版でもOK)

# 例:CUDA 11.8 対応の場合
conda install pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

2⃣ CUDAとPyTorchのインストール

Real-ESRGANやGFPGANをGPUで高速に動かすには、**CUDA(NVIDIAのGPU用ドライバ)と、それに対応するPyTorch(機械学習ライブラリ)**を正しくインストールする必要があります。

先ずは、その手順から見ていきたいと思います。

1. お使いのGPUがCUDA対応か確認する

まず、ご自身のPCに搭載されているNVIDIA製GPUがCUDAに対応しているかどうか?を確認します。確認方法については、こちらの記事の冒頭で書いていますので、ご確認ください。

2. NVIDIA GPUドライバとCUDA Toolkitのインストール

GPUを活用するには、以下の2つが必要です。

  • GPUドライバ:NVIDIA公式サイトからダウンロード(既に最新版ならOK)
  • CUDA Toolkit:PyTorchのバージョンに合わせたものをインストール

*ただし、特別な事情がない限り「PyTorchだけ入れればOK」です。PyTorchのインストール時に、自動的に対応したCUDAランタイムが入るため、CUDA Toolkitを直接インストールする必要はありません。

CUDA + PyTorchについての詳しい解説とインストール手順については、こちらの記事をご覧ください。


Real-ESRGANとGFPGANの共通点(インストール・使い方)

インストール手順(共通)

git clone https://github.com/TencentARC/Real-ESRGAN.git  # または GFPGAN に差し替え
cd Real-ESRGAN
pip install -r requirements.txt
python setup.py develop

推論コマンドの例(コマンドラインからの実行)

# Real-ESRGAN の場合(画像の高画質化)
python inference_realesrgan.py -n RealESRGAN_x4plus -i inputs

# GFPGAN の場合(顔の修復)
python inference_gfpgan.py -i inputs --face_enhance

違い(中身と出力)

項目Real-ESRGANGFPGAN
主な目的画像全体の超解像(高画質化)顔画像の復元・修復
入力画像の種類写真やイラスト全般顔が写っている画像
出力全体を滑らか&高精細にアップスケーリング顔部分を整えて自然な状態に修復
モデル名例RealESRGAN_x4plusGFPGANv1.3.pth(face_enhanceあり)

GFPGANとReal-ESRGANを連携させる方法

GFPGANとReal-ESRGANは連携が可能です。 GFPGANには--bg_upsampler realesrganというオプションがあり、背景処理にReal-ESRGANを使うこともできます。

※GFPGAN や Real-ESRGAN の依存関係(ライブラリやモデルファイル)をインストール済みであることが前提です。

python inference_gfpgan.py -i inputs --bg_upsampler realesrgan

意味:inference_gfpgan.py というスクリプトを実行して、inputs フォルダ内の画像を処理し、顔の修復には GFPGAN を使い、背景のアップスケール(高画質化)には Real-ESRGAN を使う、という内容です。

pythonPythonスクリプトを実行するためのコマンド。
inference_gfpgan.py顔画像を修復するためのメインスクリプト。GFPGANの推論処理がここに書かれている。
-i inputs -i--input の略で、「入力画像のあるフォルダ」を指定する。ここでは inputs フォルダ内の画像を処理対象としている。
--bg_upsampler realesrgan背景部分を高画質化する際に使用するアップスケーラーを指定。ここでは Real-ESRGAN を使用して背景もきれいにする設定。

Real-ESRGANやGFPGANをGUIで使えるツール

GUIツール とは、「コードを書かずに、画面上のボタンやメニューで操作できるツールです。
Pythonなどの知識も必要ありませんが、ツールによっては、一旦使用するファイルをダウンロードしてからクラウド上で操作する方法もあります。その際には、AUTOMATIC1111 Web UI にReal-ESRGANやGFPGANが統合されているツールを選ぶ事で設定不要でReal-ESRGANやGFPGAN使用可能です。詳しくは、こちらの記事画像生成AIツールの使用環境別の方法について書いていますのでご一読下さい。

1. AI Image Upscaler(GUIフロントエンド)

  • GitHubなどで公開されている「Real-ESRGANをラップしたデスクトップアプリ」
  • 画像をドラッグ&ドロップ → ボタン1つでアップスケール可能
  • Windows対応が多く、初心者でも使いやすい

例:

  • Upscayl:Electronベースのクロスプラットフォームアプリ(Real-ESRGAN内蔵)

2. Web UI系ツール(Stable Diffusionと連携)

Web UI系ツール(Stable Diffusionと連携)で Real-ESRGANGFPGAN を使用する方法は、いくつかの導入・利用パターンがあります。代表的なものを整理すると、次の 4通り があります。

1. AUTOMATIC1111 Web UI 内蔵の機能として使用する

難易度:低 / おすすめ:◎

  • 概要: AUTOMATIC1111 では、Real-ESRGANGFPGAN最初から統合されており、設定不要で使用可能
  • 使い方: 画像生成後、「Extras」タブや、出力オプション(txt2img/img2img)の設定欄から選択。
  • 導入: 基本的には launch.py 実行時に自動インストール(環境によっては手動インストールが必要な場合あり)。

RunPodなどのクラウドGPUを用いた実行環境で使用する方法

こちらは、RunPodというクラウドGPUを用いる方法で、非常におすすめです。クラウド上の高性能GPUを使用して生成が行える上、Real-ESRGAN や GFPGAN が最初から統合済み or オプションで有効化可能なAUTOMATIC1111のWeb UIを使用できます。多少事前の準備が必要ですが、
Python, Git, CUDA環境なども必要無いので、一度準備してしまえばとても快適です。

2. AUTOMATIC1111 Web UI 拡張機能(Extensions)から導入

難易度:中 / おすすめ:〇

  • 概要: Web UIのExtensionsメニューからアップスケーラや修復系ツールを追加。
  • Real-ESRGAN 拡張(例): 4x-UltraSharp
  • GFPGAN 拡張(例): CodeFormer を導入し、より高度な顔修復機能として併用可。
  • 使い方: 「拡張機能」→「インストール」→「Web UI再起動」で有効化。

3. 別アプリとして単体で導入・使用(後処理)

難易度:中〜高 / おすすめ:△(こだわる人向け)

  • 概要: Web UIを使わず、Real-ESRGANやGFPGANの公式リポジトリを使ってコマンドラインから画像処理
  • 活用場面:
    • 学習済みモデルの手動更新
    • バッチ処理(大量画像の自動変換)
    • 実験的なパラメータ調整
  • 注意点: Python環境が必要。依存ライブラリの競合に注意。

4. 他のWeb UI系ツール(InvokeAI、ComfyUIなど)で使用する

難易度:中 / おすすめ:〇(ツール依存)

  • 概要: AUTOMATIC1111 以外のツールでも、アップスケーラや顔修復ノードを追加して使用可能。
  • ComfyUI:
    • ノードとして Real-ESRGANCodeFormer を使える(GFPGANはやや非推奨)
  • InvokeAI:
    • 一部バージョンではReal-ESRGANのサポートあり(GUI設定で有効化)

GUIのメリット

PythonやCLIに慣れていなくても使える
複数のモデルを組み合わせて使えることが多い(例:CodeFormer + Real-ESRGAN)
出力画像をすぐに確認・保存できる


【初心者にもおすすめ!】使いやすいGUIツールまとめ

1. [Upscayl(アップスケイル)]

  • 用途画像の高画質化(Real-ESRGANベース)
  • 特徴
    • 完全無料・オープンソース
    • 対応OS:Windows / macOS / Linux
    • 画像をドラッグ&ドロップ → モード選んで「Upscale」ボタンを押すだけ
  • URLhttps://github.com/upscayl/upscayl

2. [GFPGAN GUI by Tkalayci]

  • 用途顔の補正(GFPGAN)
  • 特徴
    • Windows対応のGFPGAN専用ツール
    • コマンドライン不要、GUI操作だけでOK
    • 顔を綺麗に補正したい場合に特化
  • URLhttps://github.com/Tkalayci71/GFPGAN-GUI

3. [AUTOMATIC1111 WebUI(Stable Diffusion + 拡張機能)]

  • 用途画像生成+顔補正+高画質化
  • 特徴
    • ブラウザ上で動く多機能なGUI
    • 拡張機能でReal-ESRGAN、GFPGAN、CodeFormerを自由に組み合わせ可能
    • 画像生成から補正まで一気通貫でできる
  • 導入難易度:中級者向け(Python, Git, CUDA環境などが必要
  • URLhttps://github.com/AUTOMATIC1111/stable-diffusion-webui

一度構築すれば最強ですが、導入時だけちょっと手間がかかります。

選択基準

目的おすすめツール
顔を綺麗にしたいGFPGAN GUI(または WebUI)
写真や絵を高解像度化したいUpscayl(簡単・軽量)
画像生成と補正を一体でやりたいAUTOMATIC1111 WebUI

UpscaylGFPGAN GUIは、事前にCUDAやPython環境を用意しなくてもすぐ使えます。

  • URLをコピーしました!
目次