第A6版:今视点 上一版  下一版
标题导航
dlrb
 
2024年02月24日 星期六  
放大 缩小 默认

人工智能又进化了!

视频生成模型Sora横空出世
宁波企业可捕获哪些商机?

Sora根据“时髦女士漫步东京街头”这几个字生成的视频截图
Sora能将输入的视频改变背景。

春节刚过,OpenAI推出的视频生成模型——Sora一夜之间刷屏。只需给出文字提示,它就能根据用户意图,生成长达1分钟的逼真视频,画质堪比大制作电影。人们纷纷惊呼:“人工智能又进化了!”

Sora的诞生背后用了哪些“黑科技”,和ChatGPT有何相通之处?对于宁波的短视频和IT从业者而言,以Sora为代表的人工智能,究竟是解放生产力的“工具箱”,还是人类智力劳动的“替代者”?

1

Sora背后的“黑科技”

Sora是怎样炼成的?OpenAI的官网介绍了它的使用方式和技术含量。它不仅能“读懂”文字并生成相应视频,还能成为视频编辑工具,让静态照片“动起来”,将视频或图片向时间线前后拓展延长,也能根据文字修改其背景,可以说“妙用”非常多。

也就是说,你不仅能让它根据“时髦女士漫步东京街头”这几个字生成60秒视频,还能让一张静止的卡通人物图,“变身”为喜闻乐见的动画;将你欣赏元宵节花灯的照片,扩展为“东风夜放花千树”的动态视频,再给背景添上绚烂的烟花和眨眼的柯基犬……让想象融入现实。

从技术层面看,和大语言模型ChatGPT不同的是,Sora是一种扩散模型。它的原理是先把视频数据“降维”,将其拆分为一个个更小的单元——带有时空信息的视觉补丁(Patches),再通过Transfomer模型(即ChatGPT的基础技术)决定这些单元的“排列组合”,以根据用户的文字说明生成视频。

不过,OpenAI官网也直言,Sora目前也存在一些局限性。在模拟复杂场景的物理行为时,它难以保证其准确性,也可能不理解具体的因果关系。比如,画面中一个人咬了一口饼干,但下一秒的饼干就没有咬过的痕迹;它也可能混淆左右,出现人往跑步机反方向跑、“行走”的椅子、汉字写错等“低级错误”。

值得注意的是,眼下,Sora尚未面向大众商用,只对一些艺术家、设计师、电影制作人士开放“内测”,以便获得改进的反馈。OpenAI认为,Sora理解和模拟现实世界的能力,恰是实现AGI(即通用人工智能,相当于人类智慧程度的AI)的重要里程碑。

2

尝到AI甜头

Sora刷屏以来,最先感到“利益相关”的,当属短视频、影视、动画等从业者。它能让内容创作者以更低的成本,让创意变为现实,也让一批宁波相关人士嗅到变革的信号。

宁波西舟数字科技有限公司创始人吴向说:“去年,ChatGPT出来后,我们就已经在让AI协助拍摄了!它能一次性写出上百条视频文案,任客户挑选,只需几分钟,就能搞定此前‘憋’一天才能写出的脚本。原本招一名视频文案,现在有了AI就能省下这笔开支。”

“Sora能通过文字生成视频,意味着一些拍摄难度较大、制作成本较高的画面,可直接从AI创作中汲取灵感。比如宁波一家主营取暖器的企业,想让我们拍出油汀加热的原理,这一抽象概念无法靠拍摄实物呈现,如果把它交给Sora,生成1分钟动画就能通俗易懂。”吴向进举例道。

那么,Sora是否会取代视频从业者?

宁波数思技术有限公司总经理董家丰从事IT行业多年,他认为,目前的人工智能,只能做到现有数据的整合,即擅长总结归纳,但它并不掌握人类独创的新内容。比如产品摄影师,知道从哪个角度拍产品,更符合电商营销规律,这项工作仍具有不可替代性。

宁波90后影视创业者温腾认同这一观点。他告诉记者,影视创作涉及脚本、分镜、拍摄、剪辑、调色等一系列流程,是一套完整的工业体系。作为AI工具,Sora可以运用在概念片和游戏CG制作等部分环节,帮助动画制作者解放生产力,却无法替代所有环节的匠心。

“Sora或将给影视行业带来洗牌的机会。一些靠套用或‘山寨’他人作品的从业者,将不再有‘浑水摸鱼’的空间。这也在倒逼创作者跳出‘流量陷阱’,不断积累经验和创意,提升内容质量。”温腾称。

3

千行百业“大力出奇迹”

在影响视频创作之余,Sora将为更多领域带来“连锁反应”。

诚如中国工程院院士郑纬民所说:“算力是数字经济的底座,人工智能的发展,离不开它的‘大力出奇迹’。”Sora的诞生,是庞大算力支撑的结果。随着模型参数规模进一步扩大,对算力产业链的需求也会带来提升,也因此利好宁波相关企业和机构。

目前,宁波人工智能超算中心(一期)项目已在高新区上线,提供“一点接入、即取即用”的算力服务。作为最早“吃螃蟹”的企业之一,宁波薄言信息技术有限公司借助超算中心的“最强大脑”,打造电商和医疗等垂直行业版的“ChatGPT”,将模型训练周期从4天缩短至2天。类似的案例,或将越来越多。

Sora不仅有望带动“基础设施”,还将赋能应用场景。信达证券传媒互联网及海外联席首席分析师刘旺在接受央视财经采访时表示,如果Sora模型全面推广,会直接推动上游AI服务器、AI芯片、光通信等行业发展,推动云厂商基础设施建设;长期来看,Sora对下游教育、电商等行业也会产生促进作用。

在电商领域,宁波新东方工贸有限公司总经理、财经作家朱秋城认为,Sora能降低电商从业者的视频营销投入门槛,解放一部分剪辑师的“生产力”。电商行业可通过AI客服、VR和AR购物等方式,提升消费者的体验,而在跨境电商领域,AI还能帮助卖家跨越语言障碍,开拓更广阔的国际市场。

在其他行业,董家丰说:“未来,Sora和GPT等人工智能模型,还能植入工业机器人,帮助车间完成产品和设备的生产;融入家庭场景,帮助人们快速打理家务,成为智慧的生活助手。”届时,我们将离通用人工智能时代更近一步。记者 严瑾 文

图据OpenAI官网

放大 缩小 默认
   

宁波晚报