美国时间5月22日,人工智能研究机构OpenAI在其官方博客公布了文生视频模型Sora的最新进展。此次更新主要聚焦于提升视频生成的可控性与物理模拟的真实性,并宣布已开始向部分安全研究人员与创意专业人士开放测试权限。
根据OpenAI发布的技术博文,Sora团队近期在三个关键领域取得了进展。

“我们正在教授Sora逐步理解和模拟动态世界中的运动与互动,这是一个基础性的研究挑战。” OpenAI在博文中写道,“让研究人员和创意工作者早期接触,对于实现这一目标至关重要。”
Sora于2024年2月首次亮相,其能够根据文本提示生成长达一分钟的高保真视频,引发了行业震动。此后,视频生成赛道竞争迅速白热化。竞争对手如Runway、Pika Labs以及科技巨头谷歌、Meta等均加快了产品迭代速度。例如,谷歌的Veo模型同样承诺生成高质量、时长可观的视频。行业分析认为,OpenAI此次公布进展,旨在巩固其技术领先的公众认知,并展示其向更可控、更实用方向演进的路线图。

Sora能力的持续进化,预计将对多个领域产生深远影响。

尽管进展显著,Sora目前仍未向公众开放。业界观察人士指出,从技术演示到稳定、安全、商业化的产品,仍有诸多障碍需要克服。

未来几个月,行业关注点将集中在:OpenAI如何将研究进展整合进最终产品;测试者反馈将如何塑造Sora的功能设计;以及公司会建立怎样的内容审核与使用政策来应对误用风险。人工智能分析师李维(化名)表示:“Sora的最新进展标志着AI视频生成正从‘能看’走向‘能用’。下一阶段的竞争核心将是工作流的整合、成本控制以及构建健康的创作者生态,而不仅仅是技术参数的比拼。”
无论如何,OpenAI此次更新表明,文生视频模型的进化步伐正在加快,其对社会各层面的渗透与影响即将进入一个更深入的阶段。