NO.900 Z Image

2025.11.29公開、2025.12.03に更新されたモデル、Z imageを使ってみます。公式の解説で気になったポイントが二つありました。一つは、「実写」に特化している点。もう一つは、英語と中国語の複雑なプロンプトを理解するという点です。言語の解説については、少しおかしくなっています。

英語と中国語の両方のプロンプトをシームレスにサポートし、どの言語でも創造性を発揮できます。

このように書かれていました。

さて、それでは、同じプロンプトを使って、Filmと生成画像を比較してみたいと思います。

cute idol girl (1.1), close-up (1.2), bust-up (1.15), singing (1.0), gentle smile (1.1), red and white stage outfit (1.0), red stage lights (1.1), falling snow (1.1), soft pink glow (1.0), winter stage (1.0), no microphone (1.3), empty hands (1.1), warm and quiet mood (1.0), glowing snow (1.0)

Film
Z Image

cute idol girl (1.1), upper body (1.1), singing (1.0), gentle smile (1.1), white stage dress (1.0), soft lighting (1.0), falling snow (1.1), quiet winter stage (1.0), white spotlight (1.0), no microphone (1.0), serene atmosphere (1.0), sparkling snow (1.0)

Film
Z Image

J-pop アイドル1人、ライブ、背景はクリスマス、上半身のアップ

Film
Z imge

生成画像について
こうしてFilmと比べてみると一番の違いは、とても鮮明な画像になっている点です。Filmは、ぼやけた感じになっています。Z imgeは、解説にあるように実写特化型モデルとしてとても良いようです。「写実チャレンジ」(※以前は、「実写チャレンジ」でした。)に向いているモデルですね。

背景については、Filmより寂しいような気がしますが、これも「リアル」に寄せたためかと思われます。

3つ目の例が面白かったです。アニメとリアルの違い(※Filmは偶然かと)もそうですが、性別の違いが何より一番です。これまで、SeaArtでは、無性別なプロンプトを入力すると女性になる確率が高かったです。だから、今回の「J-pop アイドル」の解釈は、とても良かったと思います。また、プロンプトを日本語にしましたが、特に問題もないようです。恐らく、もっと詳細で長いプロンプトの時には、英語か中国語が望ましいのだと思います。

Z Image
・コストは、1枚5クレジット
・権利関係は、オールグリーン
・評価は、☆5

これから使う機会が増えそうなモデルでした。

おまけの話
「マイク」について
Filmはスタンドマイク2とハンドマイク1、Z Imageはハンドマイク3。この違いはとても大きいです。Z Imageについては試行回数が全く足りていないのでわかりませんが、InfinityとFilmなどは、この『マイク』が画像を壊してしまう場合が少なくありません。

例えば、ロックバンド、ジャズバンド、ピアニスト、ドラマー、ギタリスト、ベーシストなどの画像を生成した場合、プロンプトにはなくても、ボーカル以外の人物にスタンドマイクが生成されることがとても多いです。生成されるだけならまだ良い方で、1人に対して2つマイクが生成されて画像を壊してしまう例が少なくありません。また、ハンドマイクが宙に浮いた状態で生成されることがあります。

冒頭の話に戻ります。画像的には、スタンドマイクよりハンドマイクの方が良いですね。なぜなら、スタンド部分が人物画像の邪魔をするからです。また、ハンドマイクなら、動画化した時にも違和感なく歌って踊ってくれます。

コメント

タイトルとURLをコピーしました