张芷铭的个人博客

📅 2026-02-26

#ai #deep-learning #machine-learning

近似推断将推断问题转化为优化问题，通过最大化 ELBO（证据下界）近似求解后验分布。主要用于深度生成模型中的隐变量推断。

推断目的

根据观测推断隐变量
为参数学习提供帮助

推断的困难

无向图：节点耦合强，因子分解困难
有向图：条件相关性（explain away）导致推断困难

ELBO 推导

$$\log p(v)=\log\frac{p(v,h)}{p(h|v)}=\log\frac{p(v,h)}{q(h|v)}+\log\frac{q(h|v)}{p(h|v)}$$

两边对 $h$ 积分：

$$\log p(v)=\mathbb{E}_{q(h|v)}[\log\frac{p(v,h)}{q(h|v)}]+KL(q(h|v)||p(h|v))$$

ELBO 定义： $$\mathcal{L}(q)=\mathbb{E}_{q(h|v)}[\log p(v,h)]+H(q)$$

由于 $KL \geq 0$，ELBO 为对数似然的变分下界。

Comments