リアルタイム画像生成AI–SDXL_turbo–

2023.11.29に発表されたリアルタイム画像生成AIであるSDXL_turbo

Bing Aiの解説を引用します。
Stability AIは、リアルタイムテキスト画像生成モデル「SDXL Turbo」の発表を行いました123。SDXL Turboは、新しいAI蒸留技術である「敵対的拡散蒸留(Adversarial Diffusion Distillation:ADD)」を採用した画像生成モデルで、1ステップでの画像生成が可能です。ADDの導入により、SDXL Turboは他の蒸留手法でよく見られるアーティファクトやぼやけも回避できるようになり、リアルタイムでの画像出力が実現できるとされています123。SDXL Turboは、SDXL 1.0の次のイテレーションであり、オープンモデルとして最大のパラメータを持つことが特徴です4。SDXL Turboは、Stable Diffusionの次の進化形であり、GitHubからダウンロードできます5。

難しそうですが。Clipdropというところへ行けば試せるということなので、さっそく行ってきました。
(※AIのお試しをしすぎて、もう何が何だかわからなくてアカウントなど管理ができておりません。)
リアルタイム画像生成AIとは、何なのでしょう。キーボードを打ち始めて、早速驚くことになります。まだ、入力途中でも画像生成が始まります。記憶してこちらで紹介することも、スクショする暇もありません。

例えば、「テニスラケット」というプロンプトのはじめに「て」と打った瞬間「手」が生成されます。「テニス」まで打って少しでも間があくと、もうテニスの画像を生成するといったくらい早いです。
入力途中で、NSFW画像が生成されることがありました。これってタイピングの練習ソフトではないのかと思う程です。

驚きつつも、挙動を確認したいと思っていたら、プロンプトが頭に浮かびました。
「太陽」から初めて、惑星を次々に入力していきます。「水星」が変換候補に出なくて焦りました。
惑星を追加した瞬間画像が生成されます。最終的に、句読点を打つ暇もなくこうなりました。
「太陽水星金星地球火星木星土星」
本当は何もあせる必要などないのですが、ついついあせってしまいます。
入力を停止して、生成された画像は、

現在はベータ版です。以下の制約があるようです。
・512×512サイズしか生成できない。
・商用利用できない。
・画像のようにウォーターマークが入る。
・スピード重視なので生成画像もそれなりです。(50あるステップを1にしているとか。)
リアルタイム画像生成AI、またしても新しいAIの登場です。

コメント

タイトルとURLをコピーしました