Sora
2月 18th, 2024 by PureJyam
テキスト生成のChatGPTでAI界隈に嵐を巻き起こしたOpenAIが、今度は動画生成で世界を震撼させている。テキストで指示することで、最長1分の動画を生成できるらしいのだが、生成された動画がすごすぎてもはや意味がわからない。
与えるテキスト次第で、実写っぽいものからCGアニメーション風のものまで、様々な動画が生成可能であり、特に人間や犬、猫などの表現は並みのCGでは太刀打ちできないほどのリアリティを持っている。
カメラが固定されていて、その中で何かが動くシーンみたいな物であれば、まぁAIでできそうだという気もするのだが、上の動画に含まれる生成動画を見ると、高速で移動する電車の中から外の風景を撮っているというていの動画があって、移動しているにもかかわらず外に見える家々が全く破綻せずに描写されてる。しかも遠景と近景の見え方の違いも再現できているのだ。生成の原理が全くわからない。かつこの動画では窓に映る乗客の描写までも同時に行っている。もしCGでこのシーンを作成しようとしたらかなりの労力がかかるだろう。それをテキストによる指示だけで生成してしまえるというのは、ある意味恐ろしい。
今のところ、一般公開はされていないようなのだが、いずれサービスとして公開される可能性もある。もしこんなのが世に放たれたら、動画の世界は一変してしまうんじゃなかろうか。