Kendall系数:衡量等级相关性的稳健指标
在统计学和机器学习中,衡量变量之间的相关性是一个基础而重要的任务。除了常见的Pearson相关系数,Kendall秩相关系数(Kendall’s rank correlation coefficient)作为一种非参数的相关性测量方法,因其对异常值的稳健性和对等级关系的内在敏感性而备受青睐。
什么是Kendall系数?
Kendall系数(通常记为τ,读作"tau")是由英国统计学家Maurice Kendall在1938年提出的一种非参数等级相关系数。它衡量的是两个变量等级顺序的一致性程度,即一个变量的等级顺序是否能够预测另一个变量的等级顺序。
与Pearson相关系数不同,Kendall系数不假设变量间呈线性关系,也不要求数据服从正态分布,这使得它在处理非正态分布数据、异常值或等级数据时表现更加稳健。
Kendall系数的数学原理
基本概念
Kendall系数的核心思想是比较所有可能的�
张芷铭的个人博客
Comments