【深圳商报讯】(记者 张郗郡)视频模型Sora可以根据输入的文字指令直接生成60秒左右的视频,视频分辨率最高可达1080P,其中还包括了细致的背景、多角度的镜头以及多种类型的角色,或将带来影视行业的“工业革命”。
打开OpenAI的官网,目前官方已经公布了48条由Sora生成并且没有进行任何编辑的视频。当输入一段如下所示的文字:“一个时髦的女人走在东京的街道上,到处都是温暖的霓虹灯和生动的城市标志。她穿着黑色皮夹克……走起路来自信而随意。街道是潮湿和反光的,营造出了彩色灯光的镜子效果。一旁还有许多行人走来走去。”Sora便生成了一则如文字内容所示,长达59秒的连贯视频。视频中,“镜头”随着女人的行走而移动,并且拥有全身、脸部特写多种景别,做到了几乎能够以假乱真的程度。
此外,官网公布的视频案例还包括了自然风光、动物世界、宇宙探索等多个场景,就连生成3D效果的动画也不在话下,能够和现在市场中一些简单的3D动画制作水平相媲美。
Sora的问世,无疑是人工智能发展过程中的又一道重要里程碑。在此之前,行业内的AI视频生成模型主要包括Runway在2023年6月发布的Gen-2、PIKA Labs在2023年11月发布的Pika1.0等,但所生成视频的长度均停留在几秒至十几秒,视频的真实度也有待提高。而Sora不管是在视频的长度、复杂程度还是内容准确度方面,均展现出了目前业内最佳的水平。这也引发了影视和动画行业从业者的恐慌,许多业内人士表示,Sora的问世意味着以前需要花费大量金钱和人工的特效画面可以轻松生成,一旦真正应用到影视工业中,整个行业将面临一场巨大的“工业革命”。