独立同分布

独立同分布（i.i.d.）描述随机变量序列的两个特性：任意变量取值互不影响（独立性），且服从相同分布（同分布性）。

数学定义

对于随机变量序列 $X_{1}, X_{2}, \dots, X_{n}$ ：

{P (X_{1} \leq x_{1}, \dots, X_{n} \leq x_{n}) = \prod_{i = 1}^{n} P (X_{i} \leq x_{i}) F_{X_{1}} (x) = F_{X_{2}} (x) = \dots = F_{X_{n}} (x) (独立性) (同分布性)

核心定理

定理	公式	含义
大数定律	$\frac{1}{n} \sum_{i = 1}^{n} X_{i} a . s . μ$	样本均值收敛于期望
中心极限定理	$\frac{\sum X _{i} - n μ}{σ n} d N (0, 1)$	标准化和趋于正态
格列汶科定理	$\sup_x	F_n(x) - F(x)

应用场景

领域	应用
机器学习	训练数据假设、交叉验证、参数初始化
统计推断	参数估计、假设检验、回归分析
金融工程	收益率建模、VaR计算、蒙特卡洛模拟

检验方法

独立性检验：自相关函数、卡方检验、互信息法

同分布检验：KS检验、Anderson-Darling检验

from scipy import stats
import numpy as np
 
# KS检验两样本是否同分布
x = np.random.normal(0, 1, 100)
y = np.random.normal(0.1, 1, 100)
print(stats.ks_2samp(x, y))

常见误区

问题	说明
时间序列误用	金融数据常具自相关性
聚类数据忽视	组内相关会低估方差
分布误判	假设正态但实际厚尾

前沿方向

域适应：处理训练/测试分布差异
联邦学习：非i.i.d.数据分布问题
元学习：从非i.i.d.任务中学习

知识花园

探索

独立同分布

数学定义

核心定理

应用场景

检验方法

常见误区

前沿方向

关系图谱

目录

反向链接