
まずは、呼称について。本家のものは、『ChatGPT Images 2.0』とされているようです。SeaArtでは、『GPT Image 2』になっています。
そのどちらも使って検証したいと思います。Nano Banana系の時は、Gemini版とSeaArt版では異なる挙動が見られました。GPT Image 2はどうでしょうか。
題材は、これまで正しく生成できなかったハードルの高いものにします。
般若心経
般若心経を一枚の画像として生成してください。正しい漢字で生成し、ひらがなでふり仮名をつけて下さい。画像は横長にしてください。
SeaArt GPT Image 2

横長画像としたら横書きになってしまいました。SeaArtでは画像比率を任意に指定することができます。ChatGPT Images 2.0では、プロンプトで指定することが可能なようです。あえて横書きと入れたのは、すべてをうまく収めてくれるよう期待したからです。SeaArtでは意味がありませんでしたが、ChatGPT Images 2.0では、有効だったことが後で証明されます。
Gemini3+Nano Banana 2

抜けている部分があります。
ChatGPT Images 2.0

完璧でした。また1つ実力が証明されました。
※ふり仮名について
宗派によって読み方が異なるそうですので、その違いは気にしませんでした。画像が小さくて読めないと思いますが、ざっと見たところどれも正しいようです。
芸術は爆発だ!
「芸術は爆発だ!」と言っている岡本太郎の顔のアップ。シーンは太陽の塔がある当時の万国博覧会の風景。
ChatGPT Images 2.0

SeaArt GPT Image 2

Nano Bananaの時と同じ現象が見られました。本家の画像生成AIは、入力した言語と同じ言語でテキスト生成しますが、SeaArt版になると、テキスト部分が英語あるいは中国語になってしまいます。従って、SeaArtでは、テキスト生成の際に、言語指定が欠かせないと思います。
人間将棋
これまで本物に近づけることすらできなかったテーマです。
天童市で開催される人間将棋の風景
ChatGPT Images 2.0

SeaArt GPT Image 2

ぱっと見たところ雰囲気的には同じです。本物と比べると一つずつの人間駒が別物になっています。
注目点は、「人間将棋」というテキストのフォントです。「NO.1038 UI/UXポートフォリオ」で、Nano Banana 2とGPT Image 2を比較した時にも同じ現象が表れていました。ChatGPT Images 2.0は、テキストのフォントや色使いが素晴らしいです。しかし、SeaArt版GPT Image 2ではその良さが生かされていないことに気づきます。
月面宙返り
これまで、このテーマで画像生成するとトンデモ画像のオンパレードでした。果たして今回はどうでしょうか。
オリンピック体操鉄棒競技の月面宙返り
ChatGPT Images 2.0

背景はわからなくもないですが・・・。鉄棒が変です。
SeaArt GPT Image 2

厳密に言えば月面宙返りの技にはなっていません。しかし、1枚の画像としてはまとまっています。本家より良いものになりました。
GPT Image 2
実力は本物でした。
GPT Image 2に限らずNano Banana系あるいは他のモデルも含めて、SeaArt版になると本家と違う画像になります。これまで使ってみた朧気な印象ですが、画像的には本家より良いものになる一方、プロンプトの理解やテキスト生成についてはやや劣るのかなと思います。
おまけ
ChatGPT Images 2.0について
・プロンプトを思考モードを使って理解する
・内部的に8枚の画像を生成する
・8枚を検証して1番良いものを提示する
このような生成過程になっているそうです。
ChatGPTでは、生成過程で何をしているのかのテキストも表示されるのでわかりやすいです。
ChatGPT Images 2.0は、開発前と開発後の両方で、生成画像を2枚提示してどちらが良いかユーザーからのフィードバックを得ています。そのアンケートは毎回ではなく、少ない頻度で行われます。そのようなユーザー目線に立った開発姿勢がいいなと思います。



コメント