NO.829 Wan2.5 Image

Wan2.5 Imageを使ってみます。公式の解説ページにはとても長い文章があります。最後の方に書かれているのは、生成を繰り返しながらプロンプトを修正していけというようなことです。これまでやってきたことは正しかったのだなと安心しました。
さて、解説には、テキストのことも書かれていたので、まずはそのことについて確かめます。
たばこのパッケージデザイン。パッケージには日本語で”禁煙用たばこ”と書かれている。

失敗です。修正します。
たばこのパッケージデザイン。 (日本語テキスト “禁煙用たばこ”:1.2)

また失敗です。
Cigarette package design. The package is labeled in Japanese as “禁煙用たばこ”

テキストとしては成功ですが、ただのイラストになってしまいました。「Real」を付け足します。
Real cigarette package design. The package is labeled in Japanese as “禁煙用たばこ”

不要なテキストがありますが、まずまずでしょうか。パッケージデザインはもう少し良くしたいところですが、今はテキスト生成だけの検証に留めます。
テキストは、モデルに限らず英語プロンプトの方が正しく生成できるようです。テキスト部分のみ日本語にしたプロンプトが良いです。
次に進みます。過去回のSeaArt story検証で使用したプロンプトをそのまま使って生成してみます。
The scene is divided into four parts: Scene 1: “The gentleman thief in the top hat stands in front of the bank.” Scene 2: “The bank vault is filled with stacks of banknotes.” Scene 3: “The gentleman thief stuffs the banknotes from the vault into a duffel bag.” Scene 4: “The gentleman thief is arrested by the police and handcuffed.”

4つ目のシーンで捕まるのが警官になってしまう現象が同じでした。生成された画像も大変良く似ています。
The scene is divided into four parts: Scene 1: “The gentleman thief in the top hat stands in front of the bank.” Scene 2: “The bank vault is filled with stacks of banknotes.” Scene 3: “The gentleman thief stuffs the banknotes from the vault into a duffel bag.” Scene 4: “The gentleman thief is arrested by the police and handcuffed.”

これは、正しく生成されました。Storyと同じです。
パステルスタイルで描かれた、クリームテクスチャー紙の8枚のグリッド組成。男の子、女の子、かわいい犬、かわいい猫、公園、雨の日の風景、夕方の風景、花火大会

8枚という数指定はやはり無理なようです。モデルが違うのに生成画像はほぼ同じ感じで驚きました。内部的なことや仕組みには全く無知なのですが、何か関係ありそうです。
4パネルのポートレートシリーズ:エレガントな服装で微笑む女性。ワイルドな服装でウインクする女性。ラフな服装で笑っている女性。コートを着て怒っている女性

こちらは、Storyより良かったと思います。ほぼプロンプトの意図通りです。
花のアレンジメント作成のストーリーボード、5つのパネル:花器の選択、花材を固定し水を与えるための土台、花と葉物の選択、ハサミの選択、詳細の追加と最終的なフラワーアレンジメント

各パネルの絵がよくありませんでした。Storyの方が良かったです。ハサミ以外のパネルに同じ花が生成されています。
ラストになります。
アニメ、二つのシーン:1つ目のシーンには悪魔がいる。2つ目のシーンには天使がいる。

意図通りに生成できたので、テキストを入れてみます。
Anime, two scenes: The first scene features a demon, written in Japanese as “悪魔”. The second scene features an angel, written in Japanese as “天使”.

「悪」の文字が少し違っていますが、良しとしましょう。
SeaArt Story単独で調べていた時にはわからなかったのですが、Wan2.5 Imageで同じプロンプトを使ってみたところ様々なことがわかりました。
・SeaArt Storyでできることは、Wan2.5 Imageでもほぼできる。
・ワークフロー図とストーリーボードはどちらもできるが、画像的にはStoryが良い。
・警官が泥棒になってしまう問題は、SeaArt本体?の問題のようだ。
・いくつかの例で、ほぼ同じような画像が生成されたことから両者には内部的に関わりがあるようだ。
テキスト生成について
プロンプトは英語で書き、日本語表記部分のみ””で括って入れる方法が最適である。
ひとりごと
SeaArt Filmで、「泣く、号泣、涙ボロボロ・・・」このようなプロンプトを使うと、全く同じ女性が生成されます。目を赤く泣きはらした日本人?女性です。他のユーザーの方が創作された画像でも全く同じ女性が登場していました。Infinity以降、特定のプロンプトに対しては、特定の人物が生成されやすくなっていると思います。



コメント