春节刚过,OpenAI推出的视频生成模型——Sora一夜之间刷屏。只需给出文字提示,它就能根据用户意图,生成长达1分钟的逼真视频,画质堪比大制作电影。人们纷纷惊呼:“人工智能又进化了!”
Sora的诞生背后用了哪些“黑科技”,和ChatGPT有何相通之处?对于宁波的短视频和IT从业者而言,以Sora为代表的人工智能,究竟是解放生产力的“工具箱”,还是人类智力劳动的“替代者”?
Sora背后的“黑科技”
Sora是怎样炼成的?OpenAI的官网介绍了它的使用方式和技术含量。它不仅能“读懂”文字并生成相应视频,还能成为视频编辑工具,让静态照片“动起来”,将视频或图片向时间线前后拓展延长,也能根据文字修改其背景,可以说“妙用”非常多。
Sora生成的视频截图。
也就是说,你不仅能让它根据“时髦女士漫步东京街头”生成60秒视频,还能让一张静止的卡通人物图“变身”为喜闻乐见的动画;将你欣赏元宵节花灯的照片扩展为“东风夜放花千树”的动态视频,再给背景添上绚烂的烟花和眨眼的柯基犬……让想象绘入现实。
从技术层面看,和大语言模型ChatGPT不同的是,Sora是一种扩散模型。它的原理是先把视频数据“降维”,将其拆分为一个个更小的单元——带有时空信息的视觉补丁(Patches),再通过Transfomer模型(即ChatGPT的基础技术)决定这些单元的“排列组合”,以根据用户的文字说明生成视频。
Sora技术原理示意图。来源:OpenAI官网
“Sora在视频生成模型最关键的两项指标——时长、分辨率上,大幅超过先前模型,并具备较强的文本理解深度和细节生成能力,可以说是AI界的又一里程碑级产品。它能更好地理解物理世界,产生真实的镜头感。”中原银行首席经济学家任泽平团队如是分析。
不过,OpenAI官网也直言,Sora目前也存在一些局限性。在模拟复杂场景的物理行为时,它难以保证其准确性,也可能不理解具体的因果关系。比如,画面中一个人咬了一口饼干,但下一秒饼干就没有了咬过的痕迹;它也可能混淆左右,出现人往跑步机反方向跑、“行走”的椅子、汉字写错等“低级错误”。
Sora能将输入的视频改变背景。
值得注意的是,眼下,Sora尚未面向大众商用,只对一些艺术家、设计师、电影制作人士开放“内测”,以便获得改进的反馈。OpenAI认为,Sora理解和模拟现实世界的能力,恰是实现AGI(即通用人工智能,相当于人类智慧程度的AI)的重要里程碑。
宁波从业者善用AI工具
Sora刷屏以来,最先感到“利益相关”的当属短视频、影视、动画等从业者。它能让内容创作者以更低的成本让创意变为现实,也让一批宁波相关人士嗅到变革的信号。
“去年,ChatGPT出来后,我们就已经在让AI协助拍摄了!它能一次性写出上百条视频文案,任客户挑选,只需几分钟,就能搞定此前‘憋’一天才能写出的脚本。原本招一名视频文案,需要给出25万元至40万元的年薪,现在有了AI就能省下这笔开支。”宁波西舟数字科技有限公司创始人吴向进告诉记者。
作为一家创业公司,西舟科技已为1000余家电商企业提供产品摄影、短视频制作、3D建模等视觉服务,帮助宁波外贸企业在国际市场“乘风破浪”。Sora的消息一出,吴向进马不停蹄地向IT人士请教,并召集团队开会,告诉大家“使用AI工具的能力,将成为未来企业的核心竞争力”。
西舟数字工作人员拍摄场景。
“Sora能通过文字生成视频,意味着一些拍摄难度较大、制作成本较高的画面,可直接从AI创作中汲取灵感。比如,宁波一家主营取暖器的企业,想让我们拍出油汀加热的原理,这一抽象概念无法靠拍摄实物呈现,如果把它交给Sora,生成1分钟动画就能通俗易懂。”吴向进举例道。
那么,Sora是否会取代视频从业者?
从事IT行业多年的宁波数思技术有限公司总经理董家丰认为:“目前的人工智能,只能做到现有数据的整合,即擅长总结归纳。但它并不掌握人类独创的新内容。比如产品摄影师,知道从哪个角度拍产品,更符合电商营销规律,这项工作仍具有不可替代性。”
宁波“90后”影视创业者温腾认同这一观点。他告诉记者,影视创作涉及脚本、分镜、拍摄、剪辑、调色等一系列流程,是一套完整的工业体系。作为AI工具,Sora可以运用在概念片和游戏CG制作等部分环节,帮助动画制作者解放生产力,却无法替代所有环节的匠心。
Sora能让一张卡通图片“动起来”。
“Sora或将给影视行业带来洗牌的机会。一些靠套用或‘山寨’他人作品的从业者,将不再有‘浑水摸鱼’的空间。这也在倒逼创作者跳出‘流量陷阱’,不断积累经验和创意,提升内容质量。”温腾称。
千行百业“大力出奇迹”
在影响视频创作之余,Sora将为更多领域带来“连锁反应”。
诚如中国工程院院士郑纬民所说,“算力是数字经济的底座,人工智能的发展,离不开它的‘大力出奇迹’”。Sora的诞生,更是庞大算力支撑的结果。随着模型参数规模进一步扩大,对算力产业链的需求也会带来提升,也因此利好宁波相关企业和机构。
目前,宁波人工智能超算中心(一期)项目已在高新区上线,提供“一点接入、即取即用”的算力服务。作为最早“吃螃蟹”的企业之一,宁波薄言信息技术有限公司借助超算中心的“最强大脑”,打造电商和医疗等垂直行业版的“ChatGPT”,将模型训练周期从4天缩短至2天。类似的案例,或将越来越多。
宁波人工智能超算中心。
Sora不仅有望带动“基础设施”,还将赋能应用场景。
信达证券传媒互联网及海外联席首席分析师刘旺,在接受央视财经采访时表示,如果Sora模型全面推广,会直接推动上游AI服务器、AI芯片、光通信等行业发展,推动云厂商基础设施建设;长期来看,Sora对下游教育、电商等行业也会产生促进作用。
在电商领域,宁波新东方工贸有限公司总经理、财经作家朱秋城认为,Sora能降低电商从业者的视频营销投入门槛,解放一部分剪辑师的“生产力”。电商行业可通过AI客服、VR和AR购物等方式,提升消费者的体验。而在跨境电商领域,AI还能帮助卖家跨越语言障碍,开拓更广阔的国际市场。
在其他行业,董家丰指出,“未来,Sora和GPT等人工智能模型还能植入工业机器人,帮助车间完成产品和设备的生产;融入家庭场景,帮助人们快速打理家务,成为智慧的生活助手。”届时,我们将离通用人工智能时代更近一步。