Flux Art Fusion FP16 GGUF/v1.0 Q5

NO.820 Flux Art Fusion FP16 GGUF/v1.0 Q5

モデル Flux Art Fusion FP16 GGUF/v1.0 Q5 を使ってみます。

このモデルの特徴が良くわかるので、シンプルにそして形は少しだけ変えたプロンプトで生成してみました。(※絵、作品、画家名のみ、デザインと言葉を変えました。)

葛飾北斎の絵

とても分かりにくいかと思いますが、富士山の裾野には、現代の風景写真のような画像があります。他のモデルでは、統一されたスタイルの1枚の画像になりますが、このモデルはコラージュのような画像を生成しました。

(※本題から離れて、余談になります。興味の無い方は読み飛ばしてください。富士山がダブルで生成されています。確か2023年の過去回で指摘したことと似た現象です。その現象は、アドビの画像生成AIで起こっていました。プロンプトには全く無いにもかかわらず、背景には、横並びの富士山が2つ以上生成されるのです。アドビは、権利関係にとても厳しく、実在するあらゆるものの固有名詞は使えません。また、ユーザーの作成した画像1枚ずつにもIDが付いています。権利関係に厳しすぎたので、背景指定してもなかなか思うような画像にならないことが多かったです。以上のようなことから、どんな画像でも、AIが困った時には富士山背景になっていたのだと思います。現在の状況は、全く使用していないのでわかりません。さて、今回はその問題とは違うと思いますが、富士山ダブル生成問題は、画像生成AIが解決すべき点であると思います。これは、1本のバナナ問題と似ているのでしょうか。)

キースへリングの作品

キースへリングのテイストは感じられますが、「葛飾北斎の絵」と同様に、コラージュのような画像になりました。

北川歌麿、ビードロを吹く

何度か生成しましたが、男女でこの構図という画像から離れられませんでした。ビードロは、わからなかったようです。

鶴田一郎のデザイン、beautiful red

コピーでもオマージュでもなく独創的な画像が生成されました。プロンプトに実在アーティスト名や作品名を入れたとしても、これなら全く問題ないと思います。

Flux Art Fusion FP16 GGUF/v1.0 Q5

解説には、ペイント系やドロー系に強いというようなことが書かれています。英文を翻訳させてもなかなかよい和訳が得られず、その特徴の理解に困りました。

このモデルを使ってみて、これまでとは違ったものを感じました。とても芸術性の高い作品を生み出せるのではないでしょうか。気を付けるべき点は、独特の「顔」です。現代女性の場合は独特のAI顔になってしまうので、LoRAを足してコントロールするのが良いと思います。

名前には「Fusion」とあるので、コラージュが得意なのかなとなんとなく思いました。「Fusion」の意味は、本当は別なのでしょうか。

コメント

タイトルとURLをコピーしました