机器学习分为频率派和贝叶斯派两大流派。频率派通过 MLE 求解参数点估计,贝叶斯派通过 MAP 求解参数后验分布。
频率派 vs 贝叶斯派
| 方法 | 参数观点 | 目标 |
|---|---|---|
| 频率派 (MLE) | 参数是常量 | $\theta_{MLE}=\mathop{argmax}\theta\sum{i=1}^N\log p(x_i |
| 贝叶斯派 (MAP) | 参数是随机变量 | $\theta_{MAP}=\mathop{argmax}_\theta p(X |
高斯分布
一维 MLE
注意: 是有偏估计,无偏估计为 。
多维高斯分布
问题与解决:
| 问题 | 解决方案 |
|---|---|
| 参数自由度 过高 | 假设 为对角矩阵(Factor Analysis)或各向同性(p-PCA) |
| 单峰分布局限 | 高斯混合模型(GMM) |
边缘分布与条件分布
记 ,:
边缘分布:
条件分布:
线性高斯模型
已知 ,: