张芷铭的个人博客

MAR 通过掩码机制控制信息流,实现复杂依赖关系建模。

两种 MAR 定义

类型全称应用领域
传统 MARMultivariate Auto-Regressive时间序列分析
深度 MARMasked Auto-Regression数据填补

传统 MAR 模型

基于历史状态预测当前状态:

$$X_t = \sum_{i=1}^q A_i X_{t-i} + \epsilon_t$$

用于脑科学有效连接网络推断,如 fMRI 时间序列分析。

深度学习 MAR

以 PMAE(Proportionally Masked AutoEncoder)为例:

比例掩码策略

传统 MAE 均匀随机掩码破坏真实缺失分布。PMAE 统计各特征缺失比例,生成对齐真实分布的掩码。

缺失机制

类型说明
MAR(随机缺失)缺失概率依赖观测变量,可无偏恢复
MNAR(非随机缺失)缺失概率依赖未观测变量,需复杂模型

应用场景

场景方法
MCI 早期识别fMRI 构建 MAR 模型推断脑区因果网络
表格数据填补PMAE 比传统 MAE 性能提升 34.1%
生态网络推断近线性动态系统

PMAE 实现

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
class PMAE(nn.Module):
    def __init__(self, input_dim, hidden_dims):
        super().__init__()
        self.encoder = nn.Sequential(
            nn.Linear(input_dim, hidden_dims[0]),
            nn.ReLU(),
            nn.Linear(hidden_dims[0], hidden_dims[1])
        )
        self.decoder = nn.Sequential(
            nn.Linear(hidden_dims[1], hidden_dims[0]),
            nn.ReLU(),
            nn.Linear(hidden_dims[0], input_dim)
        )

    def forward(self, x, mask):
        masked_x = x * mask
        latent = self.encoder(masked_x)
        return self.decoder(latent)

最新进展

  • 统一评估指标:分类变量用准确率,连续变量用 $R^2$
  • 动态因果图:MAR + GNN 学习时变脑连接网络

Comments