Jensen不等式是凸分析的核心工具,在概率论、信息论、机器学习中广泛应用。

定义

为凸函数, 为随机变量:

对于凹函数,不等号反向。

凸函数定义

函数 满足:对任意

应用场景

领域应用
变分推断ELBO推导
信息论互信息下界
优化理论收敛性证明
生成模型GAN、VAE理论分析

关键性质

  • 非负性:KL散度 的证明基础
  • EM算法:E步的下界推导
  • ELBO