Pearson相关系数衡量两个连续变量之间的线性关系强度和方向,取值范围

定义

数学性质

性质说明
对称性
平移不变性加常数不影响
尺度缩放乘正数不影响 符号
取值范围

取值解释

范围相关性强度
强线性相关
中等相关
弱相关或无相关

Python 实现

import numpy as np
from scipy import stats
 
x = np.array([1, 2, 3, 4, 5])
y = np.array([2, 4, 5, 4, 5])
r, p_value = stats.pearsonr(x, y)

局限性

  • 仅衡量线性关系
  • 对异常值敏感
  • 相关不意味着因果