2025 年 12 月初,全球领先的 AI 视频初创公司 Runway 正式推出其最新一代模型 Gen-4.5,迅速在行业引发剧烈震荡。该模型在第三方权威评测平台 Video Arena 中夺得榜首,力压谷歌 Veo 3 与 OpenAI Sora 2 Pro。Gen-4.5 凭借对重力、流体动力学等物理规律的精准模拟,实现了从“视觉堆砌”到“物理真实”的质变。尽管技术指标刷新纪录,但官方与行业共识明确指出:当前的创作主体依然是人,AI 正加速从实验性玩具向专业生产力工具转型。
Runway Gen-4.5 的发布采取了突袭策略,随后于 2025 年 12 月 2 日由 CNBC 等主流媒体确认。作为一款基于潜在扩散变换器架构的通用世界模型(GWM),Gen-4.5 能够生成高达 1080p 分辨率的视频,支持长达 30 秒至一分钟的连续镜头。据官方数据,该模型的提示词遵循率高达 91%,并在 Artificial Analysis 文本转视频基准测试中拿下 SOTA(当前最佳)成绩。
Runway 团队强调,新模型通过影片与观察资料的训练,成功构建了贴近真实物理世界的能力。其核心突破在于“导演模式 2.0"与“运动画笔 3.0"的升级,前者提供精确的摄像机控制,后者支持多主体独立运动。然而,官方也坦诚指出了现有局限:模型在因果推理及物体恒存性(即物体被遮挡后依然存在的认知)方面仍存在瑕疵,目前需依赖分段生成及后期剪辑来补全逻辑链条。
Gen-4.5 的问世标志着视频大模型行业进入了新的竞争阶段。在此之前的 2025 年,行业主要聚焦于解决音画同步与基础连贯性问题,如阿里 WAN 与百度蒸汽机模型已实现端到端语音视频生成。然而,对于复杂物理交互的模拟一直是行业痛点。此前的模型往往在处理液体流动、布料飘动或物体碰撞时出现违背物理常识的现象。

Runway 此次以约 100 人的团队规模,在算力资源远不及科技巨头的情况下,选择在“物理真实性”这一垂直领域进行单点突破。这一策略直接回应了影视工业对高保真素材的迫切需求,试图在谷歌、OpenAI 等万亿市值巨头的围剿中,重新夺回全球视频生成领域的定义权。
Gen-4.5 的发布彻底重塑了全球 AI 视频模型的竞争格局。在 Video Arena 榜单上,谷歌 Veo 3 屈居第二,OpenAI 的 Sora 2 Pro 更是跌至第七,显示出专用型小团队在特定垂直场景下具备超越巨型通用模型的潜力。对于市场而言,这意味着 AI 视频生成正式跨越了“玩具”阶段,开始具备进入电影级制作流程的生产力属性。
对用户而言,高保真的物理模拟降低了后期特效合成的门槛,但并未完全取代专业流程。由于物体不连续和因果推理的缺陷依然存在,创作者仍需掌握分段生成与逻辑修补的技巧。这表明,短期内 AI 将作为强大的辅助工具赋能人类导演,而非完全替代创作主体。

消息发布后,业界反响热烈。网友普遍评价其为“颠覆者”,认为其生成的视频在重量感、动量特征及材质细节上已难以与真实内容区分。Omdia 高级首席分析师詹墨磊指出,2025 年视频生成大模型的两大突破之一便是对物理规律理解的增强,Runway Gen-4.5 正是这一趋势的集大成者。
尽管面临排名下滑的压力,谷歌与 OpenAI 尚未就此发布针对性声明,但行业观察家预测,巨头们必将加速在物理引擎融合方面的研发进程。与此同时,国内厂商如火山引擎也在加速迭代,试图在多模态理解与时空一致性建模上寻求差异化竞争。
展望未来,Runway 团队已明确表示正在针对因果推理与物体恒存性进行专项优化,预计后续版本将进一步提升长镜头的逻辑自洽能力。2026 年初被视为行业应用加速落地的关键窗口期,随着 Seedance 2.0 等竞品的相继发布,物理模拟的精度竞赛将持续升级。

值得关注的是,如何在保持物理真实性的同时,赋予模型更高的创意自由度,将是下一阶段技术演进的核心方向。对于从业者而言,掌握“人机协作”的新工作流,利用 AI 处理繁琐的物理渲染,而将核心创意与逻辑把控掌握在自己手中,将是应对这一轮技术变革的关键。
已是最新文章