DiffBIRは、Stable Diffusionの事前学習モデルを活用して、劣化画像の画像修復(超解像)ができまふ。(‘◇’)ゞ
Windows11 pro (Windows Insier Program)
マウスコンピューター製G-Tune E5-144
CPU:インテル(R) Core(TM) i7-10875H プロセッサー
メモリ:32GB メモリ
SSD (M.2):512GB NVMe SSD
グラフィックス:NVIDIA GeForce RTX2060 / 6GB
Python : 3.10 (pyenvを使用)
CUDA : 1.17
1 |
git clone https://github.com/XPixelGroup/DiffBIR.git |
1 |
cd DiffBIR |
1 2 3 |
pyenv local 3.10.5 python -m venv venv venv/scripts/activate |
『requirements.txt』を、下記の様に一部をコメントアウトします。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 |
# --extra-index-url https://download.pytorch.org/whl/cu116 # torch==1.13.1+cu116 # torchvision==0.14.1+cu116 xformers==0.0.16 pytorch_lightning==1.4.2 einops open-clip-torch omegaconf torchmetrics==0.6.0 # triton==2.0.0 opencv-python-headless scipy matplotlib lpips gradio chardet transformers facexlib |
pipでインストールします。
1 |
pip install -r requirements.txt |
下記サイトから『triton-2.0.0-cp310-cp310-win_amd64.whl』をダウンロードして、おなじフォルダに保存します。
https://huggingface.co/r4ziel/xformers_pre_built/commit/22505e3edeead471f3801ff2c3d478ffa51be755
pipでインストールします。
1 |
pip install triton-2.0.0-cp310-cp310-win_amd64.whl |
まず、既存の『torch』と『torchvision』をアンインストールします。
1 |
pip uninstall torch torchvision |
CUDA11.7対応PyTorchライブラリをインストール
1 |
pip install torch torchvision --index-url https://download.pytorch.org/whl/cu117 |
下記アドレスより学習済みモデルをダウンロードし、『weight』というフォルダを作成し、ここに保存します。
https://huggingface.co/lxq007/DiffBIR/resolve/main/general_full_v1.ckpt
https://huggingface.co/lxq007/DiffBIR/resolve/main/general_swinir_v1.ckpt
下記コマンドで起動します。
1 |
python gradio_diffbir.py --ckpt weights/general_full_v1.ckpt --config configs/model/cldm.yaml --reload_swinir --swinir_ckpt weights/general_swinir_v1.ckpt --device cuda |
ブラウザで『http://127.0.0.1:7860』にアクセスします。
付属の画像で試してみました。
左:元の画像、右:生成画像
色々あそべそうでふね~(´▽`)~