第186回遊びのテーマ
「じゃんけん」
間違いなく失敗すると思われるプロンプトで画像生成します。
DreamShaper
「グー、チョキ、パー、じゃんけんの手、背景は無し」
想定通りにできました。2番目の画像を使って、これまでに学習したあらゆる方法で修復を試みます。しかし、どれも惜しくすらなりません。
ここまでは、予想通りの展開です。
さて、今日のテーマ「じゃんけん」について。なぜこれを取り上げたかというと、「手の修復」ではなく、「手の生成」について考えるためです。
画像生成AIの解説サイトに以下の一文がありました。
「なるべく手の生成に強いモデルを使うとよい。」
そこで「手」と言えば「じゃんけん」という短絡的思考ではありました。前々回のOKのポーズでもよかったのですが…。
さて、検証に入る前に、プロンプト「じゃんけん」についてあらかじめ確かめる必要があります。「じゃんけん」は、英語で「Rock-Paper-Scissors」バラバラにすると、岩、紙、ハサミです。この後、この意味が影響するものとそうでないものがあることがわかります。
初めに、「Rock-Paper-Scissors」と入れ、次にリフレッシュアイコンをしたらすぐに「じゃんけん」に変化したので、2枚目からは「じゃんけん」というプロンプトになります。
「Rock-Paper-Scissors」
Beautiful Realistic Asians
4枚生成中NSFWが1枚ありました。手の部分に注目です。
Counterfeit-V3.0
惜しいです。
Deliberate
4枚中の1枚ですが、他の分もあわせると、チョキ、岩、紙になりました。指がとてもよいです。
RPG
手の生成状況はと言われれば、少しわかりにくいです。じゃんけんの雰囲気は出ています。
Disney Pixar Cartoon type B
じゃんけんにはなっていませんが、手指はいいです。
majicMIX lux
左手はどうなのでしょう?
SDXL
Juggernaut XL
ご覧の通りです。単語1つのプロンプトで、SDXLで画像生成するのは無理です。
ちょっと乱暴な設定をしてみます。SDXLでLoRA3個付き。
SDXL
CounterfeitXL
LoRA
Logo.Redmond – Logo Lora for SD XL 1.0
[SDXL]写真少女XL
Guild Wars [Art Style Capture] Fantasy LoRA XL
完全に、「岩、紙、ハサミ」になりました。これは少し面白い発見です。
全く検証の数が足りていませんが、「手や指」をできるだけ正しく表現したい場合は、「モデル」の選択が重要だということが少しだけわかったかなと思います。
過去の繰り返しになりますが、ネガティブプロンプトにそれらを防ぐものを入れすぎると、逆に生成してしまうことがあるので、そちらも気を付けたいです。
過去に使用していた「手を生物学的に正しく」のプロンプトはあまり通用しなくなったようです。そして、皆さんがネガティブプロンプトや修正に使っている「解剖学~」もあまり万能ではないような気がします。
手や指に関するまとめ
・ネガティブプロンプトには、あまりそれらにかかわるものを入れすぎないようにする。
・画風をそれほど重要視しない場合は、「手や指」に強いモデルやLoRAを使用する。
・画像生成後の修正より、画像生成前の準備が大切。
———————————————————————————————————-
参考生成 「じゃんけん」
Adobe Express
Image Creator 「じゃんけん」
コメント