Jensen不等式是凸分析的核心工具,在概率论、信息论、机器学习中广泛应用。
定义
设 为凸函数, 为随机变量:
对于凹函数,不等号反向。
凸函数定义
函数 满足:对任意 和 :
应用场景
| 领域 | 应用 |
|---|---|
| 变分推断 | ELBO推导 |
| 信息论 | 互信息下界 |
| 优化理论 | 收敛性证明 |
| 生成模型 | GAN、VAE理论分析 |
关键性质
- 非负性:KL散度 的证明基础
- EM算法:E步的下界推导
- ELBO:
Jensen不等式是凸分析的核心工具,在概率论、信息论、机器学习中广泛应用。
设 为凸函数, 为随机变量:
对于凹函数,不等号反向。
函数 满足:对任意 和 :
| 领域 | 应用 |
|---|---|
| 变分推断 | ELBO推导 |
| 信息论 | 互信息下界 |
| 优化理论 | 收敛性证明 |
| 生成模型 | GAN、VAE理论分析 |