
リップシンクの第2回になります。
外部で作成した音声を使ってリップシンクの機能を試そうと思います。
久しぶりにCoeFontへ行ったら既に無料枠を使い切っていました。そこで、グーグルやマイクロソフトのサービスへ行ってみましたが、使いにくそうでした。更に調べて、VOICEVOXというソフトをインストールして使うことにしました。かの有名な「ずんだもん」の音声が使えるソフトです。
早速、音声と元画像を用意して、リップシンクの機能を使ってみました。
元画像

リップシンクで生成
音声:VOICEVOX/四国めたん
音声の方は、少し違和感があります。VOICEVOXに調整機能はあるのですが、違和感を無くせるほど細かい調整はできません。
SeaArt側へアップロードする音声ファイルは、2秒から30秒である必要があります。音声ファイルの長さに関わらず、コストは80クレジット固定のようです。
話している言葉と口の動きは半分ほど同調しているように思います。違和感がなくなるまでAIが進化していけばいいのですが。そうなれば、本当の意味でのリップシンクに。



コメント