张芷铭的个人博客

Train-Avg Probability 是模型置信度的"体温计",能提前发现过拟合、数据不平衡等潜在问题。

健康范围

概率值状态说明
≈ 0.5正常学习模型对分类不确定
→ 0/1过拟合模型过于自信
偏向某侧数据不平衡标签分布问题

问题诊断

现象原因解决方案
持续接近 0/1过拟合/标签泄漏增加正则化
剧烈震荡学习率过高降低 LR
长期稳定 0.5模型未学习检查数据质量

联合分析

  • 配合 Loss:Loss 下降但概率极端 → 过拟合
  • 配合 Accuracy:高准确率 + 极端概率 → 可疑

示例

1
2
3
4
5
6
# 健康训练
Epoch 1: Prob=0.51 | Loss=0.69 | Acc=0.60
Epoch 10: Prob=0.58 | Loss=0.53 | Acc=0.78

# 过拟合预警
Epoch 15: Prob=0.92 | Loss=0.10 | Acc=0.99

进阶监控

1
2
3
4
wandb.log({
    "Prob_Histogram": wandb.Histogram(all_probs),
    "Prob_Std": np.std(all_probs)
})

Comments