プロンプトの原則

NO.237 プロンプトの原則

これまで、プロンプトについては、たくさん確かめましたが、行き当たりばったりたったので反省しきりです。もう一度、原点に返って、基本から学びたいと思います。Stable Diffusionの公式にプロンプトについての解説があります。全文英語なので、DeepLに翻訳させてみました。画像は載せられないので、省略しています。Stable Diffusionだけではなく、すべての画像生成AIにも通用するとのことなので転載します。なかなか難しいところもありますが、なんとなくでも理解したいなと思います。

以下のリンクは、公式サイトになります。

DreamStudio

プロンプト・エンジニアリングの基本
Graverman#0804によるプロンプティング・ガイドより引用
12月7日更新
AIアートの世界に足を踏み入れたばかりの人にとって、プロンプト・エンジニアリングは難しく見えるかもしれない。このガイドでは、基本的なプロンプトのさまざまな要素について説明し、初心者が想像できるものであれば何でも作れるようになるための強固な土台を提供する。

  1. 核となるプロンプト
    プロンプトの中心となるテーマ、題材、人物などを最もシンプルに表現したもの;

パンダ
剣を持った戦士
スケルトン
シンプルなプロンプトでは、このプロンプトを中心に他のプロンプトが構成されることがよくあります。以下は 1~3 の例です:

初心者のうちは、このようなシンプルなプロンプトを使用して、その日を終わらせたくなるものです。コアプロンプト単体では、新しい機種ではDreamStudioのデフォルト設定で比較的うまく動作することが多いのですが、それ以前の機種やデフォルト設定以外では画質が低下することがあります。

さらに、コンセプト的にはプロンプトと一致しているが、これらの画像はかなり一般的である。プロンプトはもっと具体的であるべきであり、それは…


  1. スタイル
    スタイルはプロンプトの重要な部分です。AIモデルは、要求されたスタイルを認識できなかった場合、通常、関連する画像で最も一般的なものをデフォルトとします。

例えば、「風景」というコアプロンプトが与えられた場合、モデルは写実的な風景や油絵のスタイルの風景を生成する可能性が高い。

効果的なコアプロンプトと一緒によく選ばれたスタイルを持つことは、時には完全に実現されたコンセプトを作成するのに十分です。コアプロンプトの後、スタイルの選択は、シンプルなプロンプトの中で最終的なイメージに最も影響を与えます。

最もよく使われるスタイルは以下の通りです:

リアリスティック
油絵
鉛筆画
コンセプトアート
プロンプトでスタイルを呼び出す方法はいくつかあります。

例を挙げると、写実的なイメージのプロンプトの場合、次のような書式が考えられます:

[コアプロンプト] の写真
[コアプロンプト] の写真
[コアプロンプト], ハイパーリアリスティック
[コアプロンプト], リアル

もちろん、これらの修飾語を組み合わせて、よりリアルさを追求することもできますが、ちょっとしたことが大きな効果を生むことがよくあります。

ここで、セクション1のパンダを上記の各プロンプトに当てはめてみましょう:

油絵のようなスタイルの画像の場合、プロンプトに「[コアプロンプト]の油絵」のように追加するとうまくいきます。

これを修正するには、プロンプトを再実行するか、負の重み付け(後述)を使用します。

「パンダの油絵」

鉛筆画のようなイメージの場合は、「a pencil drawing of」をコアプロンプトに追加するか、プロンプトを「[コアプロンプト] pencil drawing」にするのが簡単な方法の1つです。

「パンダの鉛筆画」

風景画も同様だ。

「パンダの生息地の風景画」


  1. アーティスト
    あなたのスタイルをより具体的に、またはイメージをより首尾一貫したものにするには、プロンプトにアーティストの名前を使用することができます。例えば、非常に抽象的なイメージにしたい場合は、”in the style of Pablo Picasso”、または単に “Picasso “と付け加えることができます。

どのような要素があなたの心を揺さぶる作品に貢献しているのかについて多くのことを学ぶことができますし、他の方法では決して出会うことがなかったかもしれない素晴らしいアートやアーティストの作品をたくさん発見することができます。

肖像画家
ジョン・シンガー・サージェント
エドガー・ドガ
ポール・セザンヌ
ヤン・ファン・エイク

油絵画家
レオナルド・ダヴィンチ
フィンセント・ファン・ゴッホ
ヨハネス・フェルメール
レンブラント

ペン/鉛筆画家
アルブレヒト・デューラー
レオナルド・ダ・ヴィンチ
ミケランジェロ
ジャン=オーギュスト=ドミニク・イングレス

風景画家
トーマス・モラン
クロード・モネ
アルフレッド・ビアシュタット
フレデリック・エドウィン・チャーチ
注:画家の名前を混ぜ合わせると、どの画家が描いたとも違う、面白そうな絵になることがある。

「レオナルド・ダ・ヴィンチとフレデリック・エドウィン・チャーチによるパンダの油絵」


  1. 仕上げ
    仕上げとは、プロンプトを本当に思い描いたとおりに仕上げるために追加する要素のこと。極端な人もいる部分です。

比較的シンプルなプロンプトでは、仕上げに「artstationでトレンド」を追加して洗練されたアーティスティックなテイストにしたり、「Unreal Engine」を追加してよりリアルなライティングにしたりします。より高度なプロンプトでは、物事ははるかに複雑になりますが、それはこのガイドの範囲を超えています!

仕上げに何を加えてもかまいませんが、ここでは効果的な例をいくつか紹介します:

高度なディテール, シュールレアリスム, artstationでトレンド, 三原色の配色, 滑らか, シャープフォーカス, マット, エレガント, イラストレーション, デジタルペイント, 暗い, 陰気, オクタンレンダー, 8k, 4k, ウォッシュアウトカラー, シャープ, ドラマチックな照明, 美しい, 後処理, 今日の一枚, アンビエント照明, 壮大な構図

「レオナルド・ダ・ヴィンチとフレデリック・エドウィン・チャーチによるパンダの油絵」


以下の部分は、DreamStudio の新機能!なので、現時点のSeaArtでは全く生かされませんが、今後取り入れられないとも限らないので最後まで掲載します。

高度なトピック プロンプトの重み付け [DreamStudio の新機能!]
プロンプトの重み付けを使用すると、特定の色、オブジェクト、プロパティなど、コンポジション内の特定の要素を増やしたり減らしたりするようにモデルを促すことができます。標準的なプロンプトから始め、プロンプトのウェイト設定を使って全体のイメージを絞り込み、合成要素を増やしたり減らしたりすることで、イメージ合成をより自由にコントロールできます。

DreamStudioでネガティブプロンプトなし(左)とネガティブプロンプトあり(右)のプロンプトを並べて比較。この場合、ネガティブプロンプトは、同じ入力プロンプトを維持しながら、木、茂み、葉、または緑を目立たなくするようモデルに指示するために使用されます。

ウェイト “1 “は全力。ウェイト”-1 “は完全な負の強さである。プロンプトの影響力を弱めるには、小数を使用する。

例えば、”A professional color photograph of a bearded man on the sidewalk, fujifilm : 1 | centered : 1 “というプロンプトは、歩道にいるひげを生やした男性ではない、中央に配置されたアイテムを得ることが多い:

私たちが求めている “中央 “の要素を保ちながらこれを軽減するには、”中央 “のプロンプトの重さを “髭男 “のプロンプトの重さより軽くすればよい。そのためには、1より小さい小数を使う。

歩道にいるひげ面の男のプロフェッショナルなカラー写真、fujifilm : 1 | centered : 0.5

もし、”ひげ面の男 “に対して “centered “の比重をさらに小さくしたければ、さらに小さな小数を使えばいい。

“歩道にいるひげ面の男のプロフェッショナルなカラー写真、fujifilm : 1 | centered : .1”

プロンプトの重み付けをオフにするには、プロンプトを”||”で始めます。

DreamStudioで重み付けがどのように解釈されているかを確認するには、プロンプトテキストボックスの上にあるアイコンをクリックします。プロンプトが現在どのように重み付けされているかを説明するポップアップが表示されます。


アドバンストピック ネガティブプロンプト [DreamStudioの新機能!]
ネガティブプロンプトは、プロンプトの反対で、ユーザーがモデルに何を生成しないかを指示することができます。ネガティブプロンプトは、多くの場合、つぶれた手や多すぎる指、ピンぼけやぼやけたイメージなど、不要なディテールを排除します。

DreamStudioでは、プロンプトに”| : -1.0 “を追加することで、簡単にネガティブプロンプトを試すことができます。たとえば、「|醜い、醜い:-1.0、指が多すぎる:-1.0」を追加すると、指が多すぎる問題が修正されることがあります。

結論
プロンプトエンジニアリングは、画像がどのように見えるかをよりよくコントロールすることを可能にします。正しく行えば、画質と構図が大幅に向上します。


実にたくさんのことが書かれていました。わかることもわからないこともあります。長すぎて読むのがつらいですね。ここをメモページ代わりにして、少しずつ確かめていきたいなと思います。

小さな発見がありました。小数の「0.1」は、電卓と同じで「.1」の入力で大丈夫です。「0.5」は「.5」など。


今回の一番の収穫は、「アーティスト」の部分です。今までの胸のつかえがとれすっきりしました。画家が複数名いるプロンプトの謎が解けました。

コメント

タイトルとURLをコピーしました