NO.679 haiku

今回は、Filmのテキスト生成について更に探るとともに、テキスト一体型画像生成の一手法について考えたいと思います。
まず、ChatGPTを使います。
「英語の俳句を10個作ってください。」
次に、作成された俳句をプロンプトとしてそのまま使います。更に、俳句プロンプトをテキスト生成にも使います。それでどのようになるか調べてみたいと思います。
Spring breeze softly blows
Cherry blossoms kiss the sky
A petal drifts down. 細く黒い文字で”Spring breeze softly blows
Cherry blossoms kiss the sky
A petal drifts down.” と書かれている。

画像的には、意図した通り生成できました。ただし、俳句はほとんど改変されています。
Silent autumn moon
Footsteps crunch on golden leaves
Old memories stir.細く黒い文字で”Silent autumn moon
Footsteps crunch on golden leaves
Old memories stir.”と書かれている。

こちらも画像的には良いです。テキストは、俳句の冒頭部分だけ正確に生成されました。
Cicadas cry loud
Heat rises from the still road
Even time sweats here.細く黒い文字で”Cicadas cry loud
Heat rises from the still road
Even time sweats here.”と書かれている。

テキストは、2024年までの生成と変わらない感じで適当です。
このプロンプトの形はあまりにも無謀なのかそれとも短絡的なのかと悲観していたら、4例目で完璧な画像を生成してくれました。
Storm clouds gathering
A single crow lifts its wings
Darkness learns to fly.細く黒い文字で”Storm clouds gathering
A single crow lifts its wings
Darkness learns to fly.”と書かれている。

暗くて小さいので読みにくいと思います。俳句が一字一句間違いなく生成されました。全体的に暗めの画像なのでもう少し明るくなってくれたらなと思いますが、生成の仕方としては大成功です。
Film
テキスト生成にどうしてこのような差が出てしまうのかなと疑問です。しかし、最後に成功した画像に見られるように、これだけ長い文字列を正しく生成できたのは初めてのことです。
Filmは、創作者の意図したもの(※プロンプト)を逸脱して、独自の感覚で生成するところがあります。そこは理解して使わないと駄目かなと思います。
コメント