配分函数是概率分布的归一化因子,在最大似然估计中难以直接计算,需通过 MCMC 等采样方法近似求解。

配分函数定义

对于概率分布:

其中 为配分函数(归一化因子)。

包含配分函数的 MLE

最大似然估计:

对配分函数求导:

由于此期望与未知概率分布相关,无法直接精确求解,需要近似采样。

正相与负相

定义真实分布 ,梯度可表示为:

  • 正相:第一项,从真实分布采样
  • 负相:第二项,从模型分布采样(需 MCMC)

MCMC 采样梯度上升

采样得到幻想粒子

幻想粒子区域概率高于实际分布时,最大化参数会降低这些部分的概率。

对比散度 (CD Learning)

问题:采样到达平稳分布的步数未知。

CD-k 方法:初始化采样 ,缩短混合时间。

定义:

  • (初始分布)
  • (平稳分布)

CD-k 目标函数:

即使 也通常可行。

RBM 学习

RBM 参数:

  • 可见层 、隐藏层
  • 权重 、偏置

能量函数:

梯度推导结果:

第一项直接计算,第二项通过 CD-k 采样近似。

CD-k 算法流程:

  1. 对每个样本
    • 初始化
    • 进行 次采样:
    • 累加梯度
  2. 梯度除以