NO.762 真上からの視点

画像生成を頼まれました。
要望は、
・ハンバーガーのバンズだけを真上から見た画像
・サーモンのお寿司を真上から見た画像
・玉子のお寿司を真上から見た画像
でした。ハンバーガーは中身やはみ出ている部分は不要、お寿司はシャリ不要でネタだけということでした。
GPTsにそれらのプロンプトを頼みましたが、お寿司プロンプトにはシャリも入っていました。
top burger bun only, single piece, top-down view, overhead shot, golden brown color, sesame seeds, fluffy texture, realistic, no patty, no background, no shadows, isolated object, photorealistic, high detail
SeaArt Film

Google Whisk

single piece of salmon sushi, top view, realistic, vivid orange salmon, visible white fat lines, no background, no shadows, isolated, sushi rice, photorealistic, glossy texture, studio lighting
SeaArt Film

Google Whisk

全く同じプロンプトでも、このように視点が異なって生成されました。依頼された方は、どちらもGoogle Whisk画像に満足されていました。
そこで玉子は、Google Whiskで生成しました。

GPTsは、Stable Diffusion用プロンプトを生成するので、SeaArt向きなはずなのですが、今回、期待に応えてくれたのはGoogle Whiskでした。だからと言って何かが悪いというわけではありません。その特徴を知れば対処もできると思います。
プロンプトで初めに「上から視点」と宣言しても、後の方に「シャリ」などを入れてしまうと、すべてを取り込もうとするのでうまくいかないのでしょうか。真上からの視点画像は、少し試行錯誤が必要なようです。
視点の他に、プロンプトについては、背景無し、影なしと入っていてもSeaArtは無視して生成してしまうことがわかりました。本来ネガティブプロンプトに入れる部分をプロンプト欄に入れても反映されないのでしょうか。しかし、他の画像生成AIではそのやりかたでも反映されると思います。
今回、見てきたようにSeaArtではプロンプトが思い通りに反映されないことがあります。ずっと、ユーザー側のプロンプトが悪いのかなと思っていたことが、実はそうでもないということがわかりました。
あるプロンプトを使うときに、いろいろな生成AI(画像生成AI)を使って試すのも良いと思います。現時点での生成AIは以前と違って、問いかけに対してストレートに画像生成してしまう(画像生成する)ようになりましたので簡単に試せると思います。
入力したプロンプトに対して生成画像に違和感を覚えた時は、Gemini(or Whisk),Copilot(DALL・E),Poeなどを使って、プロンプトそのものを検証してみるといいかもしれません。



コメント