Stable DiffusionのCFG Scaleについて解説

Stable Diffusion

当サイトはプロモーションを含みます。

CFG Scaleって何かな?

CFG Scaleでは、プロンプト内容に従う強さを調整することが出来ます。

例えば、プロンプト内に「Apple」の呪文を使っているのに、りんごが中々生成できない時があります。

プロンプト内に呪文内容が多いほど生成しにくくなります。

そこで、CFG Scaleの数値を上げることで、りんごがある画像生成の確率を上げることができます。

最適な数値に設定することで、プロンプト内容に沿った画像生成がされやすくなるので時間短縮につながります。

この記事では、CFG Scaleについて解説します。

CFG Scaleとは

CFG Scaleとはプロンプト内容に従う強さのことです。

数値を「1〜3」くらいにして低くすることで、プロンプト内容から離れた画像生成がされてクオリティも下がっていきます。
数値を高くすることで、プロンプト内容に沿った画像生成がされる確率が上がります。

ですが、数値を上げ過ぎてもプロンプト内容に従わなくなってきたり、クオリティが劣化してくるので最適な数値設定を見つける必要があります。

CFG Scaleを最適な数値に設定することで、クオリティーが上がるだけでなく、プロンプト内容に沿った画像生成がされる確率が上がり、少ない画像生成枚数で仕上げることができて時間短縮につなげることができます。

希望している画像生成が中々できない時は、CFG Scaleを上げて調整しましょう。

CFG Scale1から30まで比較

ここではCFG Scaleを「1〜30」まで生成してどうなるのか比較検証してみます。

今回の例では、プロンプト内に金髪・紫目・花飾り・白ドレス・りんごを指定して、ネガティブプロンプトには海を生成しないように指定して画像生成してみます。


以下の画像では、CFG Scaleを「1」にして生成した結果になります。

ある程度プロンプトに沿ってはいるものの、りんごが見たらない結果になりやすかったです。

一番気になったのがクオリティの低さです。

プロンプトに「masterpiece , best quality」を入れているにも関わらず品質が低い結果となりました。


以下の画像では、CFG Scaleを「3」にして生成しています。

プロンプト内容に沿った画像生成がされるようになってきますが、少しだけクオリティが低いように見えます。

ですが、CFG Scale「1」よりは良い結果となっています。


CFG Scale「6」になると、クオリティも高くプロンプト内容に沿った画像生成もされやすくなっていました。


CFG Scale「10」でも「6」と同じくらいのクオリティを保っています。

「6」よりもプロンプト内容に従って画像生成されやすい傾向にあったのでおすすめの数値です。


CFG Scale「17」以上になるとクオリティが劣化してきて、さらにはプロンプト内容に従わなくなってきます。

左側の画像では、PS VITAなのかSwitchなのかよく分からないゲーム機っぽいのが写っています。


CFG Scale「30」になるとほとんどプロンプト内容に従っていません。

右側の画像では従う気0です。


CFG Scaleを「0」から「30」の数値まで上げて全て画像生成してみると、以下の画像のようなグラフ結果のようになります。

あくまでも目安程度のグラフですが、縦は画像の質とプロンプト内容に従った強さであり、横はCFG Scaleの数値になっています。

これらの結果からおおよそですが、「7〜10」の数値くらいがクオリティが高く、プロンプト内容にも沿った画像生成がされやすかったです。

「6」以下、または「11」以上になってくると、少しずつクオリティが劣化したりプロンプト内容に従わなくなってきます。

目安グラフを参考にして良いCFG Scaleの数値に設定しましょう。

CFG Scaleの推奨値

プロンプト内容に従いやすく、クオリティの高い画像生成がされやすいCFG Scaleの推奨値ですが、「6〜14」の設定くらいが安定して良い結果になっていました。


以下の画像は、CFG Scale「6」と「14」数値の比較画像になります。

クオリティはどちらも同じくらいになっています。

CFG Scale「6」では柔らかい印象になっているのに対して、「14」ではシャープさのある印象になる傾向がありました。

クオリティが劣化する可能性もありますが、プロンプト内容を重視するなら「14」くらいに設定して上手く画像生成させる確率を上げるといいでしょう。

呪文の順番によっても生成確率は変わる

りんごの生成がしずらかったのですが、りんごである「apple」の呪文をプロンプトの一番先頭に入れると優先されやすくなるので生成確率が上がります。

CFG Scaleを変えても確率が低いと思ったら試してみてください。

呪文によって生成のしやすさが変わる

「apple」の呪文では生成されずらかったのですが、「drink」に変更することで飲み物の画像生成がしやすくなりました。

呪文内容によっても生成確率が変わるので、もし生成されずらいなら類似した別の呪文を入れてみたり、別の物に変更するといいでしょう。

まとめ

以上でCFG Scaleについて解説しました。

CFG Scaleは最適な数値に設定することで、イメージに沿った画像生成をすることができるので時間短縮につながります。

CFG Scaleのおすすめ設定値は「6〜14」になります。


プロンプト内の先頭に生成させたい呪文を入れることによって、さらに画像生成させる確率を上げることができます。

呪文によって生成のしやすさが変わるので、上手く生成できなかった場合は似たような別の呪文に変更することも検討してみてください。

よりプロンプト内容を強めて理想的な画像生成をしたい場合は「強調構文」がおすすめです。

強調構文の使い方について、以下の記事で紹介しているので良ければ読んでみてください。

タイトルとURLをコピーしました