画像生成AIのStable Diffusionですが、リアル系の画像を生成したいときに「photorealistic」が使われます。
photorealisticの数値によって、どれくらい出力が変わるかを研究してみました。
モデルはChilloutmix、学習にJapaneseDollLikeness(LoRA)を使っています。
photorealisticの値による比較結果
photorealisticなし
まずは、photorealisticを入力せずに出力してみます。
プロンプトはこちら。(ネガティブプロンプトはありません。)
best quality, ultra high res, 1girl, ,looking at viewer, face<lora:japanesedolllikenessV1_v15:0.7>
リアル寄りのイラストとしては優秀ですが、不自然ですね。
ここからphotorealisticの値を少しずつ増やしていきます。
photorealistic:0.2 の場合
次がプロンプトになります。
best quality, ultra high res, 1girl, (photorealistic:0.2) , looking at viewer, face<lora:japanesedolllikenessV1_v15:0.7>
ややリアル寄りになった印象です。
目を細めてみればリアルと言えなくもないですね。
photorealistic:0.6
次がプロンプトです。
best quality, ultra high res, 1girl, (photorealistic:0.6) , looking at viewer, face<lora:japanesedolllikenessV1_v15:0.7>
だいぶリアルに近づいてきた気がします。
リアルの写真を加工したくらいの感じでしょうか。
photorealistic:1.0
次がプロンプトです。
best quality, ultra high res, 1girl, (photorealistic:1.0) , looking at viewer, face<lora:japanesedolllikenessV1_v15:0.7>
ほぼ写真といってもいいくらいですね。
photorealisticの値はこれくらいがいいのではないでしょうか。
photorealistic:1.4
次がプロンプトです。
best quality, ultra high res, 1girl, (photorealistic:1.4) , looking at viewer, face<lora:japanesedolllikenessV1_v15:0.7>
写真ぽいと言えば写真っぽいですが、少し加工が強すぎる印象ですね。
目の色や頬の赤みが少し気になります。
photorealistic:1.8
次がプロンプトです。
best quality, ultra high res, 1girl, (photorealistic:1.8) , looking at viewer, face<lora:japanesedolllikenessV1_v15:0.7>
ここまでいくとかえってリアル感が損なわれて、ややSFっぽくなってしまっています。
あえてこういった表現を狙う場合以外は使わなさそうです。
結論
photorealisticの値は高くても1.0前後が良く、2.0に近づくとかえって不自然になる。
リアル系の画像を出力したい場合は、1.0程度にするのが良い。
まとめ
今回は、画像生成AIの “Stable Diffusion”のphotorealisticについて研究してみました。
他のプロンプトについても研究していきます。