在AI视频生成领域,OpenAI的Sora一度树立了令人惊叹的标杆。然而,来自中国初创公司剪映(字节跳动旗下)的Kling AI,正以其对真实物理世界的深刻模拟能力发起强力挑战。我们经过为期一周的深度测试,生成了超过50个视频片段,旨在全面评估这款被誉为“中国版Sora”的工具,究竟实力如何。
Kling AI由剪映团队开发,是一款基于扩散模型的文生视频工具。其核心卖点是宣称拥有“强大的3D时空联合注意力机制”和“模拟真实物理引擎”,能够生成高达1080p分辨率、最长10秒的视频。目前通过官方渠道限时免费向公众开放体验。
我们首先测试了其物理引擎的宣称。在提示词“一只猫跳上沙发,沙发坐垫轻微凹陷并回弹”中,Kling成功生成了猫跳跃的连贯动作,并且坐垫的形变与恢复过程相当自然,符合物理直觉。相比之下,在测试其他同类工具时,这种细微的材质互动常常被忽略或表现生硬。在另一测试“水杯被打翻,液体在桌面上蔓延”中,水流的形态和扩散速度也展现了合理的流体动力学特征,尽管在液体与桌面边缘的交互细节上仍有提升空间。

我们使用提示词“一个穿着红色毛衣的小女孩在公园里奔跑,镜头跟随她移动”进行了15次测试。其中,有11次成功保持了小女孩红衣装扮的稳定性,未出现中途变色或变形。镜头运动平滑,背景的树木和长椅在透视变化中保持了合理的连续性。生成长度达到10秒时,角色面容在80%的测试中保持了一致,仅有少数视频在最后几帧出现轻微特征漂移。
Kling对电影术语的理解令人印象深刻。输入“电影感镜头,一只鹰在雪山之巅翱翔,先是特写鹰眼,然后快速拉远成为全景航拍镜头”。生成的视频确实包含了从特写到全景的流畅转场,景别变化自然,体现了对镜头语言的深度理解。我们测试了包括“推轨镜头”、“仰拍”、“慢动作”在内的10种术语,其准确执行率约为70%。

优势:
不足:

我们将Kling与当前主流竞品进行核心维度对比:
总体而言,Kling在核心生成质量上,尤其是物理世界模拟方面,展现出了与Sora演示视频掰手腕的潜力,并在可访问性上具有当前显著优势。

Kling AI非常适合以下人群与场景:
目前暂不适用于需要长叙事、严格多角色交互及精细口型同步的复杂影视项目。

基于我们的测试经验,提供以下建议以获取最佳效果:
总结来说,Kling AI并非Sora的简单复刻,它在物理真实性和镜头艺术性上的突出表现,标志着中国在AI视频生成领域已进入全球顶尖竞争行列。尽管在时长和复杂逻辑上仍有局限,但其免费开放的态度和卓越的生成质量,无疑为整个行业注入了新的活力,也让普通创作者得以提前触摸未来。我们期待其后续在时长扩展和逻辑精度上的持续进化。