北京,2024年5月22日 —— 中国人工智能公司深度求索今日正式发布其新一代基础大模型DeepSeek-V3。该公司在新闻发布会上宣布,相较于前代产品,新模型在多项核心评测中性能平均提升超过50%,而推理成本则大幅降低50%。此举标志着中国在降低大模型应用门槛、推动技术普惠方面取得关键进展。
根据深度求索官方发布的技术报告,DeepSeek-V3的突破性表现源于其创新的混合专家(MoE)架构与训练方法优化。

我们的目标不仅是追求榜单上的高分,更是让强大的AI能力变得人人可用。成本降低一半,意味着更多的企业和开发者能够负担得起最顶尖的模型服务。
”
当前,全球AI大模型竞赛正从单纯追求参数规模,转向效率、成本与性能的平衡。国际上有谷歌的Gemini、Meta的Llama系列,以及OpenAI的GPT-4等强劲对手。在中国市场,百度文心、阿里通义千问、腾讯混元等科技巨头模型与月之暗面(Kimi)、智谱AI(GLM)等创业公司同台竞技。

深度求索作为专注于大模型研发的创业公司,其DeepSeek系列此前已凭借开源策略和强劲性能在开发者社区中获得广泛关注。此次发布V3版本,被业界视为其在闭源商用模型赛道的一次重要发力。据来源:科技产业分析报告(2024年5月)显示,中国大模型市场正进入应用落地关键期,成本成为制约企业大规模部署的核心因素之一。

DeepSeek-V3“性能提升、成本减半”的特点,预计将对行业产生多重影响:

一位不愿具名的云计算企业AI负责人评价:“
如果其宣称的成本数据在实际业务负载中得以验证,它将为整个行业的定价策略带来压力,并迫使所有玩家重新审视自己的技术路线和商业模式。
”

尽管技术指标亮眼,但DeepSeek-V3面临的挑战依然清晰。首先,在复杂推理、逻辑一致性及与真实世界连接等层面,大模型仍需持续进化。其次,激烈的市场竞争意味着,除了技术指标,模型稳定性、开发生态、客户服务及合规能力同样至关重要。
深度求索表示,下一步将聚焦于垂直行业的深度适配,并探索多模态能力的融合。人工智能专家张凯教授指出:“来源:张凯教授访谈(2024年5月)中国AI大模型的发展已从技术突破期进入规模化应用期。像DeepSeek-V3这样兼顾性能与成本的技术突破,是产业健康发展的关键信号。未来竞争的核心,将在于如何将技术优势转化为不可替代的用户价值和产业解决方案。”
随着DeepSeek-V3的入局,中国乃至全球AI大模型市场的竞争格局或将迎来新的变数,一场围绕“性能-成本比”的竞赛已悄然拉开序幕。