张芷铭的个人博客

自回归模型(AR)利用历史数据预测未来值,是时间序列分析和 NLP 自回归生成的基础。

基本定义

$p$ 阶自回归模型 $AR(p)$:

$$y_t = c + \phi_1 y_{t-1} + \phi_2 y_{t-2} + \cdots + \phi_p y_{t-p} + \varepsilon_t$$

平稳性条件

特征方程根落在单位圆外:

$$1 - \phi_1 z - \cdots - \phi_p z^p = 0$$

ACF/PACF 特征

  • ACF:拖尾(指数衰减)
  • PACF:$k > p$ 处截尾

参数估计

方法说明
OLS$\hat{\phi} = (X^T X)^{-1} X^T y$
Yule-Walker自协方差方程组求解

阶数选择

  • AIC:$AIC = 2k - 2\ln(L)$
  • BIC:$BIC = \ln(n)k - 2\ln(L)$
  • 选择最小化准则的阶数

建模流程

1
2
3
4
5
6
7
8
import statsmodels.tsa.api as smt

# 拟合 AR(2)
model = smt.AutoReg(series, lags=2, trend='c')
results = model.fit()

# 预测
forecast = results.predict(start=len(series), end=len(series)+4)

扩展模型

模型说明
ARMAAR + 移动平均
ARIMA差分 + ARMA
NNAR神经网络自回归

NLP 自回归生成

$$P(w_{1:T}) = \prod_{t=1}^T P(w_t | w_{1:t-1})$$

特性AR(GPT)NAR
生成顺序并行
质量较低
速度$O(n)$$O(1)$

应用场景

  • 短期预测:股票、销售量
  • 信号处理:语音增强
  • NLP:文本生成

局限性

  • 需平稳序列
  • 线性假设限制
  • 长期预测误差累积

Comments