NO.366 画像生成AIに特化した生成AI
※はじめにお断りしておきます。掲載例以外にもいろいろ試しています。また、前半部分は、今回のタイトルから少し離れています。
GPTs「MKPrompt for Image」を利用してプロンプトを生成します。
Rock guitarist, on concert stage, performing an epic solo, striking a cool and powerful pose, dynamic movement, electric guitar, stylish rock outfit, energetic atmosphere, vibrant stage lights, concert audience in the background, focused on guitarist, ID shot, half-body, detailed, professional photography, dramatic lighting, live concert setting
SeaArt
デフォルト
epiCRealism
SeaArt 2.0
この設定で画像生成します。

同じプロンプトを使用して生成します。
Canva
マジック生成
映画的

SeaArt | Canva(マジック生成) | |
ロックギタリスト性別 | 使用モデル次第、女性比率高い | 指示がなければ男性 |
ロックジャンル | ハード、メタル、パンクなど 指示によって ギタリストがとても変わる | ジャンルによって少し変わる |
ポーズ | プロンプト指示に従う | ほぼ演奏スタイル |
照明 | 指示通り | 指示通り |
背景 | アリーナの雰囲気 | スタジオ、ステージ の雰囲気 |
さて、ここからが本題です。自分でプロンプトを考えると、どんなに頑張っても初めの画像を生成させることはなかなか難しいです。しかし、GPTsのように画像生成AIに特化した生成AIを使えば簡単に生成できます。
上の比較からわかる通り、モデルとLoRAの概念がある画像生成AIは大変表現力に富んでいます。半面、苦手な部分もあります。例えば、「ロックギタリスト」というプロンプトだけで、かなりの確率で生成画像のギタリストにタトゥーが入ります。あるプロンプトに対して、固定観念のようなものがあるのが特徴かな思います。そのような場合、特化型生成AIに指示するとネガティブプロンプトも簡単に生成してくれます。
ポジティブとネガティブ、両方同時にプロンプトを提案してくれるところが特化型生成AIの優れている点です。
プロンプト考案に必須というわけではありませんが、特化型生成AIは大変有用です。そちらが登場する前は、Bard(現Gemini)、Bing(現Copilot)など普通の生成AIを利用していました。このブログの古い過去記事にもあるかと思います。2024年6月現在、画像生成AI用GPTsがかなり良いです。他社のサービスとしては、Catchyの「画像生成AI用の英文」というものがなかなか使えます。(※こちらもかなり前に紹介したものです。)
コメント