NO.493 プロンプトとマルチモーダルAI
お借りしてきます。
img2imgになりました。
マリリン・モンロー Pop Art Print, ワパップ, ベクターアートスタイル , ポップアートの傑作, ポップアートポスター, Portrait of マリリン・モンロー, ポップアートの絵画, カラフルな映画アート, ベクトルアート, 前衛的なポップアート, ポップアートスタイル, A ポップアートの絵画, ファンタジーポップアート, 多色ベクターアート, マリリン・モンロー, プフグ, バイオレット・ポルサンギのポップアート
プロンプトだけお借りして「スタジオ/SeaArt Infinity」で生成します。
ここから、本題に少しだけ関係する例を示します。プロンプトには「マリリン・モンロー」が複数存在します。これを一括で別の人名に変えるには。生成AIを使うと便利です。このプロンプトの長さでは、そんな面倒なことをしなくても手入力の方が早いではないかと思われるかと思います。しかし、この方法は応用が利くので参考にしていただければ幸いです。
※「」と『』を使うと間違いなく変換してくれます。
ChatGPT
以下の文の「マリリン・モンロー」の部分を「アインシュタイン」に変えてください。『マリリン・モンロー Pop Art Print, ワパップ, ベクターアートスタイル , ポップアートの傑作, ポップアートポスター, Portrait of マリリン・モンロー, ポップアートの絵画, カラフルな映画アート, ベクトルアート, 前衛的なポップアート, ポップアートスタイル, A ポップアートの絵画, ファンタジーポップアート, 多色ベクターアート, マリリン・モンロー, プフグ, バイオレット・ポルサンギのポップアート』
変換後
『アインシュタイン Pop Art Print, ワパップ, ベクターアートスタイル, ポップアートの傑作, ポップアートポスター, Portrait of アインシュタイン, ポップアートの絵画, カラフルな映画アート, ベクトルアート, 前衛的なポップアート, ポップアートスタイル, A ポップアートの絵画, ファンタジーポップアート, 多色ベクターアート, アインシュタイン, プフグ, バイオレット・ポルサンギのポップアート』
画像生成します。
ここから本題の「マルチモーダルAI」のお話です。画像生成AI用のプロンプトを扱う場合、困ったことが起こることがあります。例えば今回の例の場合、ChatGPTではうまくいきますが、GeminiとCopilotではうまくいかないことがあります。画像生成AI用のプロンプトと宣言しなくても、プロンプトと認識していきなり画像生成してしまうことがあるからです。
Copilotはすでに画像生成が統合されているので、使い方によっては画像生成の頻度が高いです。Geminiは現時点では少しおもしろいことが起こります。画像生成を始めるのですが途中で終わって以下の説明が入ります。「もう少しでGemini Advanceに機能が実装されるよ。※文面は違います。」
生成AIのマルチモーダル化が進むと大変便利になりますが、画像生成AI族にとっては少し面倒なことが起こることがあります。その意味で今回の検証は、あまり適切な例ではありませんでした。
もっと簡単な例としては、生成AIにプロンプトを作らせる場合が挙げられます。テーマを与えてプロンプトを作るように指示すると、いきなり画像生成を始めることがあります。Copilotはその傾向が顕著です。Geminiは、画像生成機能が今は組み込まれていませんが、その挙動は先ほど示した通りです。
2024.10.28時点で、プロンプトを扱う場合に限り、ChatGPTがいいかなと思います。
コメント