2024年2月15日に、OpenAIが動画生成AIの「Sora」を発表しました。
まだ利用はできませんが、デモ映像の質感を見るだけでも革命的な生成AIであることがわかる素晴らしいクオリティでした。
自分が使ってない時点であれこれ言うのもなんですけども、Soraの所感と、いざ使える段階になったときに僕が使いたい利用シーンなどを妄想しながらいろいろ書き留めておきます。
Text to Videoで60秒の動画を生成できる
まずはOpenAIのSoraのページを貼っておきます。サイト内にはデモ動画がたくさん掲載されてますので、詳しくはこちらをご覧ください。
これまでもText to Videoのサービスはありましたが、それらのサービスと比較して一気に進化した印象があります。
人が街を歩いてくる映像があったんですけども、人々に動きはあるんですが、街がうねうね動いたりしないんですね。
何が動くもので何が動かないものなのかを理解した上で映像が作られているんです。
2Dのものとただ3Dにしたとか、一部を動かしたとか、そういう次元ではなくなりました。
Image to Videoも可能
下記のページによると、画像から動画を生成する「Image to Video」も可能なようです。
こちらのサイトの「Animating DALL·E images」の見出しのところをご覧ください。
正直、テキストから動画を作るとしたらガチャの試行回数が増えすぎると思ったんです。Text to Imageですらかなりの試行回数が必要なのに、それが動画となるとうまくいくまでどのくらいガチャを回さないと行けないのかなと思ってしまいました。
ただ、画像から動画を生み出すことができるのであれば話は変わってきます。
動画を作る前に絵コンテを作るイメージで画像を作成し、それに動きを加えるためにSoraを利用するのであれば、自分が理想とする映像にかなり近くなると思います。
自分が使うならYouTube動画の挿絵に使いたい
これまでYouTubeの動画制作をするにあたり、数秒だけ間を持たせたいと思うことが何度もありました。
僕の場合は自分の顔を映しておいてお茶を濁すか、静止画でどうにかするか、概ねこの2択だったんですけど、3択目ができるっていうことですよね。
そこに当てはまる最適な映像を生み出すことが容易にできるのであれば積極的に使いたいです。
また、僕は音楽もやってますので、MVを作るのにも使えそうだなと思いました。
気になるのは価格感
かなりすごいものであることはデモ動画で分かったものの、問題は現実的な価格感なのかどうかです。
Image to Videoによってガチャを引く回数が減ったとしても、60秒の動画を作るためにいくらかかるのかによっては、躊躇なく使えるのか慎重にならざるを得ないのかが変わってきます。
個人的には、60秒の動画を作るために2,3ドル程度の価格感であればガンガン使いたいと思ってます。
いずれにせよ、使える日が来るのが楽しみです。