神经网络算法 - 一文搞懂Loss Function（损失函数） - 文章 - 开发者社区

本文将从 *****损失函数 的本质、 损失函数

的原理、 损失函数 的算法***** 三个方面，带您一文搞懂 损失函数

Loss Function

。

picture.image

损失函数

一、 损失函数 的本质

机器学习“ 三板斧 ” ：选择模型家族， 定义损失函数量化预测误差 ， 通过优化算法找到最小化损失的最优模型参数。

picture.image

机器学习 vs 人类学习

损失函数的本质： 量化模型预测与真实结果之间的差异。

picture.image

损失函数的本质

picture.image

损失函数的位置

二、 损失函数 的原理

误差反映单个数据点的预测偏差，损失则是整体数据集的预测偏差总和。损失函数运用这两者原理，聚合误差以优化模型，降低总体预测偏差。

误差（Error） ：对单个数据点预测结果与真实值之间的差异，用于评估模型在特定数据点上的预测准确性。

定义：误差是指模型在对单个数据点进行预测时，其预测结果与真实值之间的差异或偏离程度。这种差异反映了模型预测的不准确性或偏差。
计算：误差可以通过多种数学公式来计算。其中，绝对误差是预测值与真实值之间差值的绝对值，用于量化预测偏离真实值的实际大小；平方误差则是预测值与真实值之间差值的平方，常用于平方损失函数中，以便更显著地突出较大的误差。
误差棒： 误差棒通常以线条或矩形的形式出现在数据点的上方、下方或两侧，其长度或大小代表了误差的量级。这种可视化方法有助于识别潜在的问题区域，并指导进一步的模型改进或数据分析。

误差棒

损失（Loss） ： 损失是衡量机器学习模型在整个数据集上预测不准确性的总体指标，通过最小化损失可以优化模型参数并改进预测性能。

定义：损失是衡量机器学习模型在整个数据集上预测的总体不准确性的指标。它反映了模型预测与真实值之间的差异，并将这些差异进行聚合， 以提供一个标量值来表示预测的总体不准确性。
计算：损失的具体计算是通过损失函数来完成的。损失函数接受模型的预测值和真实值作为输入，并输出一个标量值，即损失值，表示模型在整个数据集上的总体预测误差。
损失曲线 ：损失曲线直观地呈现了模型在训练过程中损失值的变化趋势。通过绘制训练损失和验证损失随迭代次数的变化，我们能够洞察模型是否遭遇过拟合或欠拟合等问题，进而调整模型结构和训练策略。

picture.image