PixArt-α Standard

No.286 PixArt-α Standard

まずは説明欄の解説をDeepLに翻訳してもらいます。

PixArt-α is a Transformer-based Text-to-Image (T2I) diffusion model whose image generation quality is on par with current state-of-the-art image generators, such as Imagen, SDXL, and even Midjourney. Additionally, it boasts significantly faster training speeds compared to existing large-scale image generators.

PixArt-αは、TransformerベースのText-to-Image(T2I)拡散モデルであり、その画像生成品質は、Imagen、SDXL、さらにはMidjourneyといった現在の最先端の画像ジェネレータと同等です。さらに、既存の大規模画像ジェネレータと比較して、トレーニング速度が大幅に高速化されています。

次に、ネットへ調べに行きましたがとても情報が少なく、日本語のものはほとんどありません。唯一わかったのは、最新のものは、『δ(デルタ)』まであるということです。そちらは0.5秒で画像生成されるとのことでした。

さて、まだなにも理解できていませんが、とりあえず使ってみることにします。

いつものようにお借りしてきました。

(若者, 雷の力を持つ美しい女性、街を破壊する複数の侵略者のロボット)、SF、女性の周りの空間が歪んで見える、破壊された大都市、侵略者に挑む、都市の衰退、燃える炎、倒壊した高層ビル、立ち上る煙、激戦、飛び火、渦巻く瓦礫、荒廃した街並み、未来的な雰囲気、(関節式スケルトンインベーダーロボット:1.45)、未来的な雰囲気、明るい色、異世界のエネルギー、ダイナミックな構図、映画のような照明、黙示録的な設定、決然とした表情、自信に満ちた態度、風になびく髪、輝く目、輝くルーン、技術的に進歩した兵器、壮大な対決、壮大なスケール、畏怖の念を抱かせる英雄的な闘い、最後の抵抗、ディストピアの未来、運命, 人類はバランスを失います、激しい感情が湧き起こる

元画像

このプロンプトを使用してすべてのスタイルで画像生成します。

PixArt-α Standard

Cinematic
Photographic
Anime
Manga
Digital Art
Pixcel Art
Fantasy Art
Neonpunk
3D Model

途中で気が付いたのですが、使用したプロンプトがとてもよくありませんでした。対象がいくつもあってコアがぶれてしまいました。

PixArt-α Standardのスタイルは、「スタジオ」と似たような選択肢になっています。しかし、生成画像を見ると違いは明らかで、こちらはとても品質がよいです。コストは、1枚当たり13か14くらいだったと思います。もう少し使ってみないと何とも言えませんが、こちらもコスト高が障壁です。


2024.04.03 21:50 追記
PixArt-α StandardのスタイルPixcel Artで、「ポジティブな合言葉」に、「テナーサックス」とだけ入れて画像生成したら

このようになりました。まったく使い方がわからなくなりました。また、コストも7でした。最近の傾向として「かかった分だけ引かれます」という仕様でしょうか。

コメント

タイトルとURLをコピーしました