AI词典

【AI词典】欠拟合 - 模型未能充分学习数据特征2026-04-24
欠拟合：定义欠拟合，是机器学习中一种模型性能不佳的状态，指模型因过于简单或训练不足，未能充分捕捉训练数据中的基本特征与规律，导致其在训练集和新的数据（测试集）上均表现较差。欠拟合的工作原理可以想象一个学生准备一场涵盖整本教材的考试。
查看详情>>
LLM 大语言模型全面解析：2026 年核心原理、技术演进与行业实战2026-04-24
一句话定义LLM（大语言模型）是基于海量语料训练、拥有千亿级参数的深度学习系统，能理解并生成类人自然语言。技术原理：从概率预测到智能涌现要真正理解大语言模型（LargeLanguageModel,LLM），我们不能仅仅将其视为一个“更聪明的聊天机器人”，而必须深入其底层架构，剖析它是如何从一
查看详情>>
【AI词典】过拟合 - 模型过度匹配训练数据的现象2026-04-24
过拟合：定义过拟合是机器学习中一种常见的模型缺陷，指模型在训练数据上表现过于优异，以至于“死记硬背”了训练集中的噪声、细节乃至随机波动，导致其在未见过的数据上泛化能力急剧下降的现象。过拟合的原理想象一个学生为了通过历史考试，没有理解历史事件的因果脉络，而是逐字逐句背诵了整本教科书和所有习题的答案。当考
查看详情>>
【AI词典】学习率 - 控制模型参数更新步长的超参数2026-04-23
学习率：定义学习率是机器学习与深度学习中的一项关键超参数，它定量地控制着模型在每次参数更新时的调整步长，直接决定了模型在优化过程中收敛的速度与最终性能的优劣。学习率的工作原理我们可以将模型训练过程想象成一个人在山谷中寻找最低点（即损失函数的最小值）。
查看详情>>
【AI词典】Adam优化器 - 自适应矩估计的神经网络优化算法2026-04-23
Adam优化器：定义Adam优化器（AdaptiveMomentEstimation）是一种在深度学习领域广泛使用的、结合了动量（Momentum）和自适应学习率思想的迭代优化算法，其核心是通过计算梯度的一阶矩（均值）和二阶矩（未中心化的方差）估计，为每个参数动态调整独立的学习率。Adam优化器的工作原理
查看详情>>
【AI词典】随机梯度下降SGD - 一种高效的优化算法2026-04-23
随机梯度下降SGD：定义随机梯度下降（StochasticGradientDescent,SGD）是一种用于优化机器学习模型参数的迭代算法，其核心思想是通过每次随机选取一个（或一小批）训练样本来计算梯度并更新模型参数，从而高效地逼近损失函数的最小值。随机梯度下降SGD的工作原理想象你身处一片多山
查看详情>>
【AI词典】反向传播 - 神经网络训练的核心算法2026-04-23
反向传播：神经网络训练的核心算法反向传播是一种通过计算损失函数对神经网络中所有权重参数的梯度，并利用梯度下降法迭代更新这些参数，从而使网络输出逼近预期目标的监督学习算法。它是现代深度学习得以高效训练的基石，常被简称为“Backprop”或BP算法。原理：误差的逆向分配与调整可以将反向传播的工作原理类
查看详情>>
【AI词典】梯度消失 - 神经网络训练中的梯度衰减问题2026-04-23
梯度消失：定义梯度消失是指在深度神经网络的反向传播训练过程中，误差梯度从输出层向输入层逐层传递时，其数值（范数）指数级衰减至接近于零的现象。这导致网络前部的层（尤其是靠近输入的层）的参数更新极其缓慢甚至停滞，从而严重阻碍网络的深度学习和性能提升。
查看详情>>
【AI词典】Dropout正则化 - 防止过拟合的神经网络训练技术2026-04-23
Dropout正则化：定义Dropout正则化是一种在神经网络训练过程中，通过随机“丢弃”一部分神经元及其连接来防止模型过拟合的技术。其核心思想是在每次训练迭代中，强制网络不依赖于任何少数特定的神经元，从而提升模型的泛化能力。Dropout正则化：工作原理可以将Dropout的工作原理类比于一个团队协
查看详情>>
ChatGPT 4.5 深度评测：2026 年最强闭源大模型能力解析2026-04-23
一句话定义C
查看详情>>

1 ...11 12 13 14 15 ...52

AI词典

热门文章

最新热点

热点标签更多

AI词典

热门文章

最新热点

热点标签 更多

热点标签更多