Etid nouvo: Performans DeepSeek-V3 siperè GPT-4, kout rezonman anpil 90%

Nouvo AI2026-04-12 17:24:00

北京时间今日凌晨，深度求索公司发布最新研究论文，宣布其新一代大语言模型DeepSeek-V3在多项基准测试中性能超越OpenAI的GPT-4，同时将推理成本大幅降低90%。这项突破性进展可能重塑全球AI产业的竞争格局。

重要细节

根据深度求索公司在预印本平台arXiv上发布的论文《DeepSeek-V3: 通过混合专家架构与系统优化实现高效推理》，新模型在多个关键指标上实现了显著提升。

性能表现：在MMLU（大规模多任务语言理解）、GSM8K（数学推理）、HumanEval（代码生成）等主流基准测试中，DeepSeek-V3的综合得分超越GPT-4约3-5个百分点。
成本突破：通过创新的“混合专家”（MoE）架构与推理系统优化，模型在同等输出质量下，单次推理的算力消耗与成本仅为同类顶级模型的十分之一。
模型规模：论文披露，DeepSeek-V3采用了包含6710亿参数的超大规模MoE架构，但每次推理仅激活约370亿参数，这是实现高效率的关键。

“我们的目标不仅是追求性能的极限，更是要打破‘强大模型必然昂贵’的固有认知。DeepSeek-V3证明了通过算法与系统工程的双重创新，可以同时实现卓越的性能与极致的效率。”论文第一作者、深度求索首席科学家在报告中写道。

深度求索是中国领先的人工智能研究公司，此前发布的DeepSeek系列模型已在开源社区获得广泛关注。当前，全球大模型竞赛正陷入“军备竞赛”的困境，模型性能的提升往往伴随着训练与推理成本的指数级增长，严重制约了AI技术的规模化应用。

其主要竞争对手OpenAI的GPT-4及传闻中的下一代模型，以及谷歌的Gemini Ultra、Anthropic的Claude 3系列，均被视为行业标杆。降低推理成本已成为整个行业寻求突破的核心痛点。

此项研究成果预计将对行业产生多重影响：

降低应用门槛：推理成本降低90%意味着企业部署和使用顶级AI能力的财务负担将大幅减轻，可能加速AI在各类商业场景中的渗透。
加剧行业竞争：性能与成本的双重优势将给OpenAI、谷歌等巨头带来直接压力，可能迫使它们重新评估其技术路线与定价策略。
推动开源生态：深度求索有将其模型开源的历史。若DeepSeek-V3部分或全部开源，将为全球开发者社区提供一个高性能、低成本的替代选择，可能改变市场力量对比。

一位不愿具名的云服务商AI业务负责人对媒体表示：“如果这一成本数据在实际部署中得到验证，它将彻底改变我们采购和提供模型服务的经济学模型。”

尽管论文数据亮眼，但模型的真实世界表现、长期稳定性以及具体的商业化部署方案仍有待观察。深度求索公司表示，将于近期开放DeepSeek-V3的API测试申请，并计划在后续发布更详细的评估报告。

业内专家指出，这场竞赛的重点正从单纯的“性能比拼”转向“性价比之争”。谁能以更低的成本提供可靠的顶级智能，谁就可能在下一阶段的AI普及浪潮中占据主导。DeepSeek-V3的出现，标志着这场关键战役已经打响。

Nomb total vizit pòs la: 124