阿里巴巴集团于今日(5月9日)正式推出其大语言模型“通义千问”的2.5版本。据官方发布的信息及第三方评测报告显示,该版本在中文语境理解、知识问答及代码生成等多项核心能力测试中,得分首次超越OpenAI的GPT-4,标志着国产大模型在关键性能指标上取得里程碑式突破。
在发布会上,阿里巴巴集团公布了通义千问2.5的详细评测结果。该模型在多个权威基准测试中表现突出。
阿里巴巴集团CEO吴泳铭在发布会上表示:“通义千问2.5不仅在技术指标上实现了飞跃,更重要的是,它正加速从技术突破走向广泛的产业应用。” 来源: 阿里巴巴集团官方声明 (2024年5月9日)

“我们致力于降低AI的使用门槛,让每一家企业都能基于通义千问,便捷地开发出属于自己的专属大模型和应用。”吴泳铭在发言中强调。
此次通义千问2.5的发布,正值全球AI竞赛进入“深水区”。过去一年,国内外科技巨头竞相发布大模型,但焦点已逐渐从单纯的参数规模和演示效果,转向实际性能、成本控制和产业落地能力。
作为中国互联网科技巨头,阿里巴巴将通义千问定位为“AI基础设施”,其发展路径紧密围绕云计算业务。与追求通用人工智能(AGI)的OpenAI不同,阿里云智能集团更强调将大模型能力注入其庞大的企业客户生态中,推动B端(企业端)的智能化转型。

此前,包括百度文心一言、腾讯混元等在内的国内主流大模型,均在多个中文评测中宣称达到或接近GPT-4水平,但此次通义千问2.5在多个公开、可复现的基准测试中取得领先,引发了行业高度关注。来源: 智通财经报道 (2024年5月)
通义千问2.5的发布,预计将从多个层面影响AI产业格局。

首先,提振国产大模型信心。 在核心评测指标上实现对国际顶尖模型的超越,为国内AI产业链提供了更强的技术自信和市场说服力,可能加速企业在AI采购上的决策。
其次,加剧云服务市场竞争。 大模型已成为云厂商争夺客户的关键筹码。通义千问2.5的性能优势,将直接增强阿里云在吸引开发者及企业客户方面的竞争力,迫使其他云服务商加快模型迭代和降价步伐。

第三,推动AI应用开发热潮。 更强大的基础模型意味着开发者能够构建出能力更强的AI应用。阿里巴巴同时宣布大幅降低模型调用价格并开放更多定制化工具,旨在吸引更多开发者在阿里云平台上进行AI应用创新,构建生态系统。
分析人士指出,大模型竞争的下一阶段,胜负手将取决于“AI应用落地”的深度与广度。技术指标的领先只是起点,能否将技术优势转化为实实在在的商业解决方案和用户价值,才是关键。

阿里巴巴方面透露,通义千问已通过阿里云服务了超过9万家企业客户,累计落地了超过1000个行业解决方案。其应用场景覆盖电商、金融、医疗、法律、教育等多个垂直领域。例如,在编程领域,通义灵码已成为中国程序员中普及度较高的AI编码助手;在办公场景,通义千问已全面接入钉钉。
独立科技分析师张毅认为:“这次得分超越具有象征意义,但真正的考验才刚刚开始。模型性能、成本、安全性、数据隐私以及能否深入解决行业特定痛点,是决定大模型最终市场地位的复合因素。通义千问2.5的发布,将压力抛给了所有竞争对手,也预示着AI大规模赋能的时代正加速到来。” 来源: 艾瑞咨询分析师评论 (2024年5月)
随着通义千问2.5等强力模型的入局,中国乃至全球的AI竞争,正从发布会上的技术演示,转向千行百业真实场景中的生产力革命。