桃太郎(再)

NO.467 桃太郎(再)

かなり前ですが、他の画像生成AIと比較しながら、絵本作りにチャレンジしたことがあります。現在では、当時と環境が全く異なるので、もう一度トライしたいと思います。

初めにGPTsを使います。
『桃太郎の絵本を作るために複数の画像を生成したいです。』

6枚の画像を生成する回答が得られましたので、プロンプトを貼り付けて1枚ずつ生成します。

桃の流れてくる場面

  • プロンプト: “Clear river flowing gently through a peaceful Japanese countryside, with a large peach floating on the water. Traditional wooden houses and green hills in the background.”

桃太郎が桃から生まれる場面

  • プロンプト: “A large peach split open with a baby boy, Momotaro, emerging from inside. An elderly Japanese couple in traditional clothing watches in amazement in a cozy rural home setting.”

桃太郎が犬、猿、雉を仲間にする場面

  • プロンプト: “Momotaro, a young boy in traditional samurai-like attire, walking along a forest path with a loyal dog, mischievous monkey, and proud pheasant by his side, all looking ready for adventure.”

鬼ヶ島に向かう場面

  • プロンプト: “A small boat carrying Momotaro, the dog, monkey, and pheasant, sailing across the ocean towards a distant island with dark cliffs and ominous clouds gathering overhead.”

鬼退治の場面

  • プロンプト: “Momotaro and his animal companions bravely fighting fierce oni (demons) at the entrance of a dark, rocky fortress. The oni are large with blue and red skin, wielding heavy clubs.”

勝利後、宝を持って帰る場面

  • プロンプト: “Momotaro, the dog, monkey, and pheasant returning triumphantly with a cart full of treasures, being welcomed by the elderly couple in a bright and joyful Japanese village.”

SDXLモードでの生成

Fluxで生成された画像を見るとプロンプトはかなり優秀かなと思います。そこで、比較のために、モードSDXL、モデルAnimagine XL V3.1でも生成しました。

1、2枚目は、肝心の部分が抜けてしまいました。SDXLとFluxでは、プロンプト理解力が違うようです。また、Fluxの方はどれも桃太郎がわかる画像になっていますが、SDXLの方は鬼退治の場面では鬼になってしまうなど他の部分に影響されています。

Fluxを使えば、ストーリーに合った場面ごとの画像を生成できます。しかし、複数枚に統一感を出すことは難しそうです。統一感を出すにはデフォルトやSDXLモードが向いていると思いますが、今度は、プロンプトづくりが難しそうです。

結論としては、SeaArtで絵本作りをすることはなかなか難しそうです。しかし、GPTsの力を借りれば、ある程度ストーリーに沿った画像生成ができることがわかりました。

コメント

タイトルとURLをコピーしました