WindowsでAIプログラミング

DiffBIR:超解像や劣化画像を修復

はじめに

DiffBIRは、Stable Diffusionの事前学習モデルを活用して、劣化画像の画像修復(超解像)ができまふ。(‘◇’)ゞ

実装

試行環境

Windows11 pro (Windows Insier Program)
マウスコンピューター製G-Tune E5-144
CPU:インテル(R) Core(TM) i7-10875H プロセッサー
メモリ:32GB メモリ
SSD (M.2):512GB NVMe SSD
グラフィックス:NVIDIA GeForce RTX2060 / 6GB

Python : 3.10 (pyenvを使用)
CUDA : 1.17

方法

Git Clone

カレントディレクトリの移動

仮想環境構築(Pyenv で Python3.1.5 を使用)と起動

必要ライブラリのインストール

requirements.txtの変更、インストール

『requirements.txt』を、下記の様に一部をコメントアウトします。

pipでインストールします。

Tritonのインストール

下記サイトから『triton-2.0.0-cp310-cp310-win_amd64.whl』をダウンロードして、おなじフォルダに保存します。
https://huggingface.co/r4ziel/xformers_pre_built/commit/22505e3edeead471f3801ff2c3d478ffa51be755

pipでインストールします。

PyTorchのインストール

まず、既存の『torch』と『torchvision』をアンインストールします。

CUDA11.7対応PyTorchライブラリをインストール

学習済みモデルを配置

下記アドレスより学習済みモデルをダウンロードし、『weight』というフォルダを作成し、ここに保存します。

https://huggingface.co/lxq007/DiffBIR/resolve/main/general_full_v1.ckpt
https://huggingface.co/lxq007/DiffBIR/resolve/main/general_swinir_v1.ckpt

起動コマンド

下記コマンドで起動します。

ブラウザで『http://127.0.0.1:7860』にアクセスします。

付属の画像で試してみました。

左:元の画像、右:生成画像

おわりに

色々あそべそうでふね~(´▽`)~

この記事を書いた人
化学系で博士号を取得したが、 あるとき、これからの時代はプログラミング!、と目覚める。 pythonを用いてデータ解析や機械学習に没頭。 最近は、Pytorchで作ったONNXモデルを、Nuxt3にのせたWebサービスの開発、 ChatGPT や Stable Diffusion に没頭中☆('ω')☆
SNSでフォローする

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA