阿里巴巴集团于今日(5月9日)正式发布其最新大规模语言模型“通义千问2.5”。据官方公布的数据显示,该模型在多个权威基准测试中表现优异,部分成绩超越了OpenAI的GPT-4,标志着中国在通用人工智能(AGI)核心模型领域的竞争力达到新的高度。
根据阿里巴巴云智能集团发布的新闻稿,通义千问2.5在多项关键评估中取得了突破。其核心升级集中在复杂推理、指令遵循和多轮对话能力上。

“通义千问2.5在理解、推理和生成能力上的全面提升,是我们向通用人工智能迈出的坚实一步。它不仅是一个技术里程碑,更是我们为开发者、企业和个人用户提供更强大AI基础设施的承诺。” —— 阿里巴巴集团资深副总裁、阿里云智能集团CTO周靖人表示。来源: 阿里云官方新闻稿 (2024年5月9日)
此次发布正值全球AI大模型竞争白热化阶段。国际市场上,OpenAI的GPT-4 Turbo、谷歌的Gemini系列以及Anthropic的Claude 3持续迭代。国内方面,百度文心一言、腾讯混元、月之暗面Kimi等模型也频繁更新,在长上下文、多模态等方向展开角逐。阿里巴巴此次将通义千问主力模型版本号从2.1直接提升至2.5,并强调其在核心推理能力上对标国际最先进水平,意图在技术制高点上确立领先优势。

通义千问模型自2023年4月首次公开,已历经多次重大升级。此前,阿里已通过开源其70亿和140亿参数版本模型,在开发者社区中积累了广泛影响力。

通义千问2.5的发布预计将从多个层面产生影响:

分析人士指出,大模型竞争的焦点正从单纯的参数规模和语料库大小,转向更深层的逻辑推理、专业领域知识以及成本控制。通义千问2.5在综合基准测试上的突破,证明了其在第一梯队中的技术实力。然而,真正的考验在于模型在实际商业场景中的稳定性、安全性和规模化落地能力。

阿里巴巴方面表示,通义千问2.5版本模型已通过阿里云向企业客户开放,并将很快在通义官网和APP上为公众提供有限免费体验。随着多模态模型通义千问VL-Plus的同步升级,阿里正在构建一个覆盖文本、图像、音频、视频的完整模型家族。这场围绕AI基础设施的竞赛,技术突破只是开始,如何将技术优势转化为可持续的产业优势,将是下一阶段的关键。