WindowsでAIプログラミング

Stable Diffusion web UI : 使い方とパラメータ

はじめに

『Stable Diffusion web UI』には、目的別タブやパラメータがありまふ。
その説明でふ(‘ω’)ノ。

方法

タブ

tet2img

プロンプトから画像を生成。

img2img

既存の画像を元にプロンプトから画像を生成。

Extras

多々、いろいろ。

PNG Info

Stable Deffusionから生成したpngファイルから、プロンプトなどの情報をゲット。

Chekpoint Merger

学習済みモデルを元に、さらに学習を追加。

Train

モデルを作成。

OpenPose Editor

Depth Library

多々、いろいろ。

Settings

設定。

Extensions

機能を拡張。

txt2imgのパラメータ

Prompt

生成したい画像の文言でふ。
世間では、呪文とも呼ばれていまふ。
品質、描画の方向性、画質など。もちろん英語でふ。
文章でもよいでふが、最近は、単語を羅列するのがポピュラーの様でふ。
学習済みモデルが、学習しいない単語は、意味がないでふ。
学習済みモデルが、なんの単語を学習していないかは、把握する手段がありまふぇんが、、、。

ポイント1:強調

『()』は、強調になりまふ。例)(penguin)、((penguin))

ポイント2:高画質に使われる単語

masterpiece
best quality
highly detailed
ultra detailed

ポイント3:ショートカットキー
CTRL + ENTER画像生成
プロンプトの文言を選択して、CTRL + ↑、CTRL + ↓重みの変更
プロンプトで、CTRL + Z 元に戻す
元に戻した後に、CTRL + SHIFT + Z元に戻すのをやめる

Negative prompt

禁止事項の文言を入力しまふ。
『Prompt』に、生成したい画像の文言を入力しても、余分なものを生成しまふ。
これを排除するために使います。
高品質にするためも使います。

Sampling method

画像を生成するときのアルゴリズムでふ。

Width, Height

生成する画像のサイズでふ。
単位は、ピクセルでふ。
おいらの環境(VRAM:6GB)では、512×512ピクセルが限界かな(‘◇’)

Batch count

1回の生成で作成する画像の枚数でふ。

Sampling steps

操作回数。
回数を多くすると、細部まで生成できまふ。
もちろん、増やせば描画までの時間が長くなりまふ。

CFG Scale

Promptの方向性の強度でふ。
数値を大きくすると、抽象性が失われ強度が増しまふ。

Seed

乱数でふ。
『-1』は、ランダムになりまふ。
数値を設定すると、同じ乱数になり、同じ(ほぼ同じ)画像を生成しまふ。

Generate

上記のパラメータを元に画像を生成しまふ。

おわりに

パラメータにより、すごく様々な画像を生成しまふ、
すごいふふふ(‘◇’)ゞ

関連ページ

この記事を書いた人
化学系で博士号を取得したが、 あるとき、これからの時代はプログラミング!、と目覚める。 pythonを用いてデータ解析や機械学習に没頭。 最近は、Pytorchで作ったONNXモデルを、Nuxt3にのせたWebサービスの開発、 ChatGPT や Stable Diffusion に没頭中☆('ω')☆
SNSでフォローする

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA