Pearson相关系数衡量两个连续变量之间的线性关系强度和方向,取值范围 。
定义
数学性质
| 性质 | 说明 |
|---|---|
| 对称性 | |
| 平移不变性 | 加常数不影响 |
| 尺度缩放 | 乘正数不影响 符号 |
| 取值范围 |
取值解释
| 范围 | 相关性强度 |
|---|---|
| 强线性相关 | |
| 中等相关 | |
| 弱相关或无相关 |
Python 实现
import numpy as np
from scipy import stats
x = np.array([1, 2, 3, 4, 5])
y = np.array([2, 4, 5, 4, 5])
r, p_value = stats.pearsonr(x, y)局限性
- 仅衡量线性关系
- 对异常值敏感
- 相关不意味着因果