NO.441 Flux用LoRA
今回は、FluxとLoRAについて調べたことや体験したことをまとめます。
FluxやInfinityは、手足の生成が格段に良くなりました。しかし、これまでは数枚を生成していたので気づかなかったのですが、3本指や6本指が生成される場合が結構あることがわかりました。例えば、14枚のうち3枚がそのようになりました。昨日、100枚以上の画像をFluxで生成しましたが、2~3割ほどは、手足の生成が良くなかったです。
さて、FluxやFlux用LoRAについて調べたことをまとめます。
作成について
LoRAを作成するクラウドサービスを使えば安価に作成できるそうです。ローカルPCの場合は、最低24GBのGPUが必要とのことでゲーミングPC、マイニング用PC、グラフィック用PCのレベルでないと無理があるようです。
作成の仕方
驚いたことに、以前何も知らずにSeaArt上でLoRAを作成した時と同じ方法が使われていました。まず、作りたいLoRA用画像を1枚用意します。それを元に生成AIでバリエーションのある画像を作ります。そのような画像を最低でも20~30枚用意して学習させます。クラウドサービスなら30~40分でできるそうです。(※有料サービスですが安価です。)
以前、この方法を使ってSeaArt内でLoRAを作成した時は、1時間以上の時間がかかりました。また、現在では、LoRA作成のコストがとても高くなっているのでSeaArt上で作成する気にはなれません。(※一般のLoRAの場合)
また、上記の方法を一部変更した画像生成を自動で行ってくれるものも存在するようです。
クラウドサービスについて
複数のサービスがあるようです。コストは、2~3ドル程度だそうです。画像は最大で1000枚まで使用できるところがあるそうです。
FLUX.1用LoRA向けの環境
ローカルPC用には、個人の方が頑張って開発環境を作られているそうです。一般的には、有償のクラウドサービスが、Fluxコンテストを開催するなど大変力を入れているそうです。
Flux.1とLoRA
Flux.1のパラメーター数は120億で、Stable Diffusion XLのパラメーター数は35億だそうです。1年間での進化はすごいですね。すでに作成されたFlux用LoRAを使用した画像生成結果によると、とても短く簡単なプロンプトでも段違いな画像を生み出したとのことです。
さてさて、自前のLoRAを作成するのはとても厳しいですが、恐らくもう少し時間が経てば、Flux用LoRAが実装されて画像生成力が格段に上がるのは間違いないでしょう。
コメント