交叉熵损失衡量模型预测概率分布与真实标签分布的差异,是分类任务的核心损失函数。
数学定义
二分类
多分类
| 符号 | 含义 |
|---|---|
| 预测概率 | |
| 真实标签 | |
| 类别数 |
核心特点
| 特点 | 说明 |
|---|---|
| 鼓励高置信度 | 预测越准损失越小 |
| 与似然函数相关 | 最小化交叉熵等价于最大化似然 |
| 适用分类任务 | 与 softmax 结合使用 |
示例
真实标签 ,预测 :
预测 :
预测越不准确,损失越大。
交叉熵损失衡量模型预测概率分布与真实标签分布的差异,是分类任务的核心损失函数。
| 符号 | 含义 |
|---|---|
| 预测概率 | |
| 真实标签 | |
| 类别数 |
| 特点 | 说明 |
|---|---|
| 鼓励高置信度 | 预测越准损失越小 |
| 与似然函数相关 | 最小化交叉熵等价于最大化似然 |
| 适用分类任务 | 与 softmax 结合使用 |
真实标签 ,预测 :
预测 :
预测越不准确,损失越大。