NO.302 Stable Diffusion 3
初めにお断りしておきます。Stable Diffusion 3 の文字に胸を躍らせて、早速、使ってみようと思い、プロンプトを入力して、コスト45とは高いなと思いながら、生成ボタンをポチっとしたら、VIP限定で泣きました。(※あわてすぎて、「創作」の横にあるVIPマークが目に入っていませんでした。)
仕方がないので、ネットの世界へ調査に行きました。結果を簡単に報告します。
DALL-E 3 や Midjourney v6よりプロンプトの忠実性において上回っている。
このことについては、実際に生成してみないと何とも言えません。これまでの経験から言えることは、もしそれが事実だとしても、総合的には、DALL-E 3 や Midjourney v6を上回るとは言えないと思います。なぜなら、Stable Diffusion(SeaArt)は、プロンプト全体の雰囲気を感じて画像生成することができないからです。例えば、詩、歌詞、物語をプロンプト代わりに使った場合、これまで試した数々の画像生成AIの中で全体を感じ取る力は一番弱いです。しかし、だから悪いということではありません。それは、人物1人を描かせたら一番強いからです。
文字の生成が得意。
これは、すでにデモ等で実証されています。ビルの壁面に、落書きで指定した文章を書きなさいとするときちんと文字が生成されます。また、文字のタイプもいろいろ表現できるようです。段ボールにロゴを入れるというサンプルがありました。
文字に対する指定はできない。
文字は正しく生成できるものの、文字に対する指示はできません。例えば、小文字指定してもすべて大文字になるとかフォント?ロゴタイプ?の指定はできません。
複数のコアプロンプトを正しく生成できる。
例えば3つの異なるコアプロンプトとその関係性が書かれたプロンプトを正しく表現できるようになりました。この部分は今回のバージョンで最も気になるところです。
接写したスタジオ写真。
このようなプロンプトを使用すると、マクロレンズで撮影したような効果が得られます。
Stable Diffusion 3
本家の公式発表があったのは、2024.2.23です。そして、2024.4.17についに公開されました。SeaArtでもその翌日には実装されるという異例の早さだったかなと思います。ずっとVIPでしか使えないのでしょうか。一度くらいはお試しさせてくれるといいなと思います。
コメント