WindowsでAIプログラミング

ESRGAN:学習・超解像生成

はじめに

ESRGANで学習してみました。
学習には、『Google Colaboratory』を使用して、
学習モデルをPC環境で実装し、超解像生成してみました。
コードは、『GANディープラーニング実装ハンドブック』を参考にしました。

実行環境

学習:Google Colaboratory

生成:Windows 10 ( Jupyter Notebook )

参考資料

GANディープラーニング実装ハンドブック [ 毛利拓也 ]
価格:3850円(税込、送料無料) (2021/4/2時点)楽天で購入

実行

Google Colaboratoryで学習

『GANディープラーニング実装ハンドブック』を参考に、
『Google Colaboratory』のサンプルコードを使いました。
サンプルコードは、ネット上に出ています。

https://www.shuwasystem.co.jp/support/7980html/6229.html#1

10000枚程の顔の画像(これは自分で準備しました)を使って、
コードのデフォルト条件で学習をしました。
『Google Colaboratory Pro』で、GPU『V-100』使用して、
大体24時間くらいかかりました。

Jupyter Notebook(Windows 10)で超解像生成

『Google Colaboratory』で用いたコードを改変して、
PCの『Jupyter Notebook』に実装しました。
モジュール環境条件は、前回の『ESRGAN:実装方法』と同じです。

参考:『ESRGAN:実装方法

コードには、『Pytorch』の『DataLoader』が使われており、
並列処理をする箇所がありますが、
Jupyte Notebookで実装するのが手間だったので、
『num_workers=0』にして行いました。

『Google Colaboratory』で作成した学習モデル『generator_00***000.pth』をダウンロードして使用しました。

結果

コードは、元となる画像から低解像度画像をつくり、
これをESRGANで超解像画像を生成します。

元画像は、『LightWeight-GAN』で生成した画像を用いてます。

左:低解像度画像、右:生成画像

関連記事

この記事を書いた人
化学系で博士号を取得したが、 あるとき、これからの時代はプログラミング!、と目覚める。 pythonを用いてデータ解析や機械学習に没頭。 最近は、Pytorchで作ったONNXモデルを、Nuxt3にのせたWebサービスの開発、 ChatGPT や Stable Diffusion に没頭中☆('ω')☆
SNSでフォローする

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA