北京,2024年5月22日 —— 中国人工智能公司深度求索今日正式发布其新一代大语言模型DeepSeek-V3。该公司在官方技术报告中宣称,该模型在多项关键基准测试中性能超越OpenAI的GPT-4,同时其推理成本骤降至GPT-4 Turbo的十分之一,引发全球AI业界高度关注。
根据深度求索发布的技术报告,DeepSeek-V3在性能与效率上实现了标志性突破。以下是其公布的核心数据:

“DeepSeek-V3的设计哲学是让顶尖的AI能力变得极其经济、可用。我们不仅在追求性能的极限,更在重新定义大模型推理的经济学。”深度求索首席科学家在技术报告发布会上表示。
深度求索作为中国AI领域的明星初创公司,此前已凭借DeepSeek-Coder等模型在开发者社区获得声誉。全球大模型竞赛正从单纯的“规模竞赛”进入“效率竞赛”阶段。高昂的推理成本已成为阻碍大模型规模化商业应用的主要瓶颈,包括OpenAI、谷歌在内的巨头均在积极研发降低成本的方案。

此次DeepSeek-V3采用主流的混合专家架构,但通过其自研的“专家路由”算法和底层计算优化,大幅提升了专家选择的准确性与系统吞吐量。分析认为,这是其能在控制成本的同时保持高性能的关键。

DeepSeek-V3的发布预计将对AI行业产生多重影响:

深度求索同时宣布,将通过其API平台和部分云合作伙伴,以极具竞争力的价格向全球开发者提供DeepSeek-V3的调用服务。

业内专家指出,DeepSeek-V3标志着大模型竞争进入新阶段。
“过去一年,行业讨论的是‘谁的模型更强’;从今天起,问题将变成‘谁能在同等性能下更便宜,或在同等成本下更强大’。”一位不愿具名的AI行业分析师评论道。
下一步的观察重点在于DeepSeek-V3在实际大规模服务中的稳定性、多模态能力的拓展计划,以及其商业化策略的落地效果。深度求索表示,将继续致力于推动AGI(通用人工智能)的普惠化,并计划在未来季度更新其代码与数学专项模型。
随着性能边界逐渐清晰,这场由DeepSeek-V3掀起的“效率革命”,或将决定未来几年AI市场格局的走向。