NO.711 残る課題

SeaArt Filmが登場して、画像生成AIはもうほとんど不満がないレベルに到達したかなと思っていました。しかし、昨日たまたま、まだよくなっていない部分を見つけました。





一人の人がテナーサックスとトランペットなどを同時に持ってしまうような現象です。楽器そのものが不完全なことも多いです。
このような画像生成は以前からあまり変わっていません。
これがSeaArtに限った現象なのかどうか他の画像生成AIでも試してみます。
Image FX


小さくてわかりにくいですが、似たような現象が起きています。SeaArtよりは目立ちません。
Canvaの画像生成(※参考までに)


こちらは、少し前のSeaArtで見られていた現象で、ピアノとピアニストの位置関係がとても変になっています。2024年ごろまでのSeaArtもこのような生成をしていました。人とピアノの融合がよく見られたものです。
楽器の生成
・単体では、ほぼうまく生成できるようになりました。フェンダー/ストラトキャスターなどと指定するとそれらしいギターを生成してくれます。ギターを例に挙げると、2023年時点では、弦がだいたい3本から8本だったのですが、2025年6月の今はほぼ6本、時には5本から8本の範囲で生成されることがあります。また、チューニングペグと弦の数が一致していないこともたまにあります。
・トランペットやサキソフォーンなどが1画像の中にある場合、とてもくずれた画像になってしまいます。これにピアノが加わると、ピアニストがマウスピースをくわえることもあります。複数の楽器の混在はいまでに苦手です。「ピアニストがマウスピース」は他の画像生成AIでも良く起こります。
単数と複数
人間も楽器も単数なら問題ないですが、複数の人間にそれぞれの別の楽器を演奏させると今回のような画像が生成されやすいようです。
手足の生成、トランポリン、体操競技、アーチェリーなど様々な課題をクリア(※このブログ内でのお話です。)してきたSeaArtですが、複数人がそれぞれ別のことをする画像はいまだに苦手なようです。
コメント