概率图模型用图表示概率分布,分为有向图(贝叶斯网络)和无向图(马尔可夫网络),涉及表示、推断和学习三个理论部分。
概率规则
p(x1)=∫p(x1,x2)dx2
p(x1,x2)=p(x1∣x2)p(x2)
p(x1∣x2)=p(x2)p(x2∣x1)p(x1)
有向图-贝叶斯网络
因子分解:
p(x1,⋯,xp)=∏i=1pp(xi∣xparent(i))
局部结构
| 结构 | 条件独立性 |
|---|
| A→B→C | C⊥A∥B |
| B→A,B→C | A⊥C∥B |
| A→B,C→B | A⊥C,但给定 B 不独立 |
Markov 毯
与 xi 相关的部分:
p(xi∣xparents(i))p(xchild(i)∣xi)
无向图-马尔可夫网络
条件独立性
- 全局 Markov:xA⊥xB∣xC
- 局部 Markov:x⊥(X−Neighbour(x))∣Neighbour(x)
- 成对 Markov:xi⊥xj∣x−i−j(i,j 不相邻)
因子分解
p(x)=Z1∏i=1Kϕ(xci)
其中 ϕ(xci)=exp(−E(xci)),为 Gibbs 分布。
道德图
有向图转无向图:
- 将每个节点的父节点两两相连
- 将有向边替换为无向边
推断方法
| 类型 | 方法 |
|---|
| 精确推断 | VE、BP、Junction Tree |
| 近似推断 | Loop BP、MCMC、变分推断 |
信念传播 (BP)
mj→i(i)=∑jϕj(j)ϕij(ij)∏k∈Neighbour(j)−imk→j(j)
Max-Product 算法
mj→i=maxjϕjϕij∏k∈Neighbour(j)−imk→j
用于 MAP 推断,是 Viterbi 算法的推广。