KL 散度衡量两个概率分布差异,是信息论和机器学习的核心概念。

数学定义

离散分布

连续分布

核心性质

性质说明
非负性,当且仅当 时等于 0
不对称性
信息解释 近似 时损失的信息量

原理推导

其中 是熵, 是交叉熵。

应用场景

领域应用
变分推断变分下界目标函数
生成模型GAN、VAE 评估分布差异
强化学习策略优化限制更新幅度

代码实现

import numpy as np
 
def kl_divergence(p, q):
    return np.sum(np.where(p != 0, p * np.log(p / q), 0))

相关度量

度量公式
Jensen-Shannon 散度
Rényi 散度