NO.784 WAN2.2 Txt2Vid

WAN2.2 Txt2Vidが公開されたので使ってみます。
比較のために、NO.617で使ったWAN2.1 Txt2Vid使用時のプロンプトを再利用します。
(high noon cowboy duel:1.3), intense gunfight, ultra-detailed revolver shot, slow motion bullet time, cinematic tension, dust particles in the air, dramatic sun glare, extreme close-up of gun trigger, muzzle flash, bullet flying, impact sparks, enemy flinching, poncho billowing, sweat dripping, western town background, realistic motion blur, ultra-realistic lighting, dynamic camera angle, Clint Eastwood style, 4K cinematic shot
WAN2.1
WAN2.2
後ろの人の左腕が少し変で邪魔になっています。銃弾の発射については良くなりました。
1人の子どもが公園のブランコで遊んでいる、アニメ
WAN2.1
WAN2.2
WAN2.2は、動画としては割と良いのですが、プロンプトに沿っていません。「公園のブランコで遊んでいる」この部分しか合っていません。WAN2.1は、プロンプトに完全に沿っています。
ミルククラウンのできる瞬間
WAN2.1
WAN2.2
これはもう説明不要です。
最後に、今回新たに生成した動画を紹介します。
(20s woman:1.2), white one-piece dress, barefoot, long flowing hair, dancing, arms outstretched, mid-step, gentle smile, green grass field, blue sky, sunny day, bright lighting
下半身と上半身の向きがおかしいところがあります。
WAN2.2 Txt2Vid
コストは、100スタミナ(コイン)
生成時間は、5秒動画で約5分~
初めの3つの例については、WANの問題ではないかもしれない可能性があります。それは、WAN2.1を使用したのが2025年3月でWAN2.2を使用したのがそれから約5か月後という時間に要因があると思うからです。その間、SeaArtのプロンプト解釈はとても変わりました。残念ながらすべてが良くなったわけではありません。ガンマン動画は、それほど変わっていませんが、ブランコとミルククラウン動画は完全に別物になりました。
最後の例で、WAN2.2の実力がはっきりしたと思います。
公開されてから日数が経っていないので、使用した人はまだ少ないようです。そのようなわけで、WAN2.2のページに飛ぶと、同一ユーザーの同一動画が複数紹介されていました。その中に、顔だけクローズアップした動画がありました。それを見ると、顔の変化に違和感を感じました。
結論
WAN2.1では短いプロンプトが有効でしたが、WAN2.2では長いプロンプトの方が良いようです。他のユーザの方々のプロンプトの長さや内容に着目して、良い動画になっているものを参考にすると良いかなと思います。



コメント