北京时间3月19日,英伟达(NVIDIA)在其年度GTC开发者大会上正式发布了新一代人工智能(AI)图形处理器(GPU)Blackwell架构的首款产品B200。据英伟达创始人兼首席执行官黄仁勋介绍,这款旨在驱动万亿参数规模大语言模型的新芯片,在特定AI推理工作负载上的性能可比前代旗舰产品H100提升高达30倍。
此次发布的Blackwell B200 GPU以及由其构成的GB200超级芯片模块,标志着英伟达在AI算力竞赛中的又一次重大跃进。核心细节如下:

“生成式AI是我们这个时代的决定性技术。Blackwell GPU是推动这场新工业革命的引擎。”黄仁勋补充道。
英伟达凭借其GPU在AI训练市场的绝对主导地位,市值在过去一年内飙升。其上一代基于Hopper架构的H100芯片已成为全球科技巨头构建大模型不可或缺的基础设施,需求持续旺盛。然而,竞争对手如AMD(推出MI300系列)以及众多云厂商自研芯片(如谷歌TPU、亚马逊Trainium)正在加速追赶,试图分食市场。

与此同时,AI模型规模正以远超硬件算力增长的速度膨胀。OpenAI的GPT-4、谷歌的Gemini等模型参数量已达万亿级别,对更强大、更高效的算力提出了近乎饥渴的需求。英伟达此次发布B200,旨在巩固其技术护城河,满足下一代更庞大、更复杂AI模型的开发与部署需求。

B200的发布预计将对AI硬件及云计算产业产生深远影响:

对行业与客户:主要云服务提供商(CSP)如亚马逊AWS、微软Azure、谷歌云以及甲骨文云已宣布将提供基于Blackwell架构的实例。对于AI公司和研究机构而言,这意味着他们能够以更高的效率训练和运行更先进的模型,可能加速多模态AI、科学计算和复杂推理等领域的发展。然而,顶级AI算力的获取成本与门槛可能进一步提高,资源可能进一步向资本雄厚的巨头集中。

对竞争对手:英伟达此次性能宣称的幅度给AMD、英特尔等竞争对手带来了巨大压力。它们需要证明其下一代产品能够提供有竞争力的替代方案。另一方面,这也可能刺激云厂商加大自研芯片的投入,以寻求在性能和成本上获得更多自主权。
对供应链:Blackwell芯片的复杂设计和先进封装技术(涉及CoWoS-L等)将继续考验台积电等供应商的产能,相关供应链的紧张状况可能在短期内持续。
Blackwell B200不仅是一颗芯片的升级,更代表了英伟达从硬件供应商向“AI算力平台”提供商的战略深化。与其配套发布的NVIDIA Inference Microservices(NIM)等软件工具,旨在将GPU的效能最大化,并构建更牢固的软件生态壁垒。
行业分析人士指出,未来AI硬件的竞争将超越单纯的算力(TFLOPS)比拼,转向涵盖能效、内存带宽、互连技术、系统级集成以及软件栈易用性的全方位体系化竞争。来源: CNBC报道 (2024年3月19日) 英伟达通过Blackwell平台再次设定了新的标杆,但能否持续满足爆炸式增长的、多样化的AI算力需求,并应对日益激烈的竞争,将是其面临的下一个考验。AI硬件军备竞赛,已进入一个以“万亿参数模型”为基准的新阶段。