NO.817 Gemini 2.5 Flash

SeaArt内で画像情報を解析してプロンプトを取り出し、それで画像を生成しても元画像とはかなりかけ離れたものになります。
そこで、今回は、Gemini 2.5 Flashを使ってみたいと思います。
Gemini 2.5 Flashは、マルチモーダルAIです。テキストオンリーだった初期の生成AIとは違って、画像や音声ファイルなどを扱えます。
本題に入る前に、別の使用例をお話します。音楽ファイルをGemini 2.5 Flashにアップロードします。それを元に、いろいろ質問できます。
・この音楽のジャンルは?
・この歌にタイトルをつけて
・この曲に画像を付けるとしたらどんな画像がいい?
などユーザーの発想次第で使い方は様々です。
それでは、本題に移ります。SeaArtホームから一つの画像をお借りしてきました。

この画像には、LoRAが3つ使われています。
この画像をGemini 2.5 Flashにアップロードします。そして、「この画像を生成するためのプロンプトを教えて。」と問いかけます。それから回答されたプロンプトで画像生成します。
SeaArt Film
a portrait of a young woman with a bob haircut, black hair, looking to the side, wearing yellow sunglasses, yellow sweater, red lipstick, intense yellow eyes, in the style of anime and comic books, vibrant yellow and black colors, high contrast, clean lines, detailed, digital painting

設定が元画像と同じならほぼ同じものができるでしょう。
元画像からお借りして創作ボタンを押して生成すると、シードが変わって元画像と同じにはなりません。今回試した方法を使えば設定やシードを同じにしなくても似たような画像を生成できます。モデルやLoRAが違うので勿論完全に同じにはなりませんが、これだけ近ければ十分です。
もう一つ試します。自分が作った画像を使います。
元画像
SeaArt Film
砂漠で踊るダンサー、彼女は砂漠で舞い、裾が砂塵を巻き上げる。その舞は神聖な恩寵

この画像をGemini 2.5 Flashにアップロードしプロンプトを回答してもらいます。そして、再び画像生成します。
a full shot of an elegant woman, mid-motion, dancing gracefully in the desert, wearing traditional desert attire, flowing orange and yellow fabrics, golden jewelry, warm sunset lighting, sand swirling around her feet, dunes in the background, cinematic, highly detailed, realistic, photography

SeaArt内でリフレッシュアイコンを使ったり、プロンプトを再利用したり、シードを同じにしたりしなくても、同じような画像を作れることはとても面白いです。



コメント