WindowsでAIプログラミング

ESRGAN:実装方法

はじめに

『ESRGAN』は、超解像ができます。
つまり、低解像度の画像を高解像の画像に変換できます。
画像を大きくするのみではなく、自然な画像として高解像度の画像を生成します。
名前の通り、GANを使っております。

参考:https://github.com/xinntao/ESRGAN

PC環境

Windows10 pro (Windows Insier Program)
マウスコンピューター製G-Tune E5-144
CPU:インテル(R) Core(TM) i7-10875H プロセッサー
( 8コア / 16スレッド / 2.30GHz [ 最大5.10GHz ] / 16MBキャッシュ )
メモリ:32GB メモリ [ 16GB×2 ( PC4-21300 / DDR4-2666 ) / デュアルチャネル ]
SSD (M.2):512GB NVMe SSD ( SAMSUNG PM981a / M.2 PCIe Gen3 x4 接続 )
グラフィックス:NVIDIA GeForce RTX2060 / 6GB

方法

Gitでダウンロード

学習済みモデルのダウンロード

下記のサイトより『pth』ファイルのダウンロードし、『models』のフォルダに保存

https://drive.google.com/drive/u/0/folders/17VYV_SoZZesU6mbxz2dMAIccSSlqLecY

仮想環境

『ESRGAN』フォルダへ移動

仮想環境作成

アクティベイト

モジュールのインストール

『Pytorch(CUDA10.1対応)』のインストール

『Open CV2』のインストール

テストコマンド

結果

『results』フォルダにファイルが作成されます。

①comic

元の画像(62×90)

生成画像(248×360)

②baboon

元の画像(125×120)

生成画像(500×480)

さいごに

学習方法は、また次回に(‘ω’)ノ

関連記事

この記事を書いた人
化学系で博士号を取得したが、 あるとき、これからの時代はプログラミング!、と目覚める。 pythonを用いてデータ解析や機械学習に没頭。 最近は、Pytorchで作ったONNXモデルを、Nuxt3にのせたWebサービスの開発、 ChatGPT や Stable Diffusion に没頭中☆('ω')☆
SNSでフォローする

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA