涌现能力(Emergent Abilities)指人工智能模型(尤其是大语言模型)在参数规模、数据量或计算量跨越特定阈值时,突然显现出在较小规模模型中完全不存在或表现极差的新能力。这些能力并非通过特定编程获得,而是模型规模扩大后“自发”产生。
可以将大语言模型想象成一个由海量神经元(参数)构成的复杂网络。当这个网络规模较小时,其行为相对简单、可预测,只能完成基础任务(如单词补全)。然而,当网络规模(参数、数据)持续扩大并超过某个临界点后,其内部结构会变得极其复杂,各部分之间产生难以事先设计的、非线性的相互作用。这种高复杂度催生了新的“系统级”行为模式,即涌现能力。它类似于无数简单水分子通过复杂互动“涌现”出波浪的形态与力量,这种宏观属性无法从单个水分子的特性中直接推导。

理解涌现能力,可关联以下概念:
缩放定律、
大语言模型、
智能突现、
分布式表示、
少样本学习。

若想深入了解涌现能力的实证研究与理论探讨,可关注学术论文中关于模型“缩放定律”的研究,以及探讨“量变引起质变”在复杂系统中的哲学与科学论述。相关研究通常发表在机器学习顶级会议(如NeurIPS, ICML)上,重点关注大模型能力边界的基准测试报告。

