机器学习核心公式速查表,涵盖概率基础、线性回归、分类、降维、SVM、概率图模型等内容。
数学基础
MLE 与 MAP
θMLE=argmaxθ∑i=1Nlogp(xi∣θ)
θMAP=argmaxθp(X∣θ)p(θ)
高斯分布
p(x∣μ,Σ)=(2π)p/2∣Σ∣1/21exp(−21(x−μ)TΣ−1(x−μ))
线性回归
闭式解: w^=(XTX)−1XTY=X+Y
正则化:
- L2:argminwL(w)+λ∥w∥22
- L1:argminwL(w)+λ∥w∥1
线性分类
感知机
损失:L(w)=∑xi∈Dwrong−yiwTxi
更新:wt+1←wt+λyixi
LDA
目标:J(w)=wTSwwTSbw
解:w∝Sw−1(xc1−xc2)
Logistic 回归
p(C1∣x)=σ(wTx)
梯度:J′(w)=∑(yi−p1)xi
降维
PCA
最大化方差:J=∑j=1qujTSuj
解:S=UΛUT
p-PCA
z∼N(0,I),x=Wz+μ+ε
后验:p(z∣x)=N(WT(WWT+σ2I)−1(x−μ),I−WT(WWT+σ2I)−1W)
SVM
Hard-margin:
argminw,b21wTws.t.yi(wTxi+b)≥1
Soft-margin:
argminw,b21wTw+C∑ξi
指数族分布
p(x∣η)=h(x)exp(ηTϕ(x)−A(η))
A′(η)=E[ϕ(x)],A′′(η)=Var[ϕ(x)]
概率图模型
EM 算法
θt+1=argmaxθEz∣x,θt[logp(x,z∣θ)]
变分推断
L(q)=Eq[logp(x,z)]+H(q)
MCMC
Metropolis-Hastings 接受率:
α=min{1,p(z)Qz→z∗p(z∗)Qz∗→z}
GMM
p(x)=∑k=1KpkN(x∣μk,Σk)
更新:pkt+1=N1∑p(zi=k∣xi,θt)
HMM
参数: λ=(π,A,B)
前向算法:
αt+1(j)=∑ibj(ot)aijαt(i)
Viterbi:
δt+1(j)=maxiδt(i)aijbj(ot+1)
CRF
p(Y∣X)=Z1exp[θTH(yt,yt−1,x)]
边缘概率:p(yt=i∣x)=Z1αt(i)βt(i)