谱聚类是基于无向带权图的聚类方法,通过最小化归一化割(Ncut)将图分割为多个子图。适用于非凸数据集。
聚类思路对比
| 方法 | 思路 | 代表算法 |
|---|---|---|
| Compactness | 类内紧凑 | K-means、GMM |
| Connectivity | 图连通性 | 谱聚类 |
图定义
无向带权图 ,权重矩阵 ,相似度(径向核):
图割目标
定义 ,归一化割:
其中 为节点度。
矩阵形式
引入指示向量 ,目标函数:
其中:
- :度矩阵(对角矩阵)
- :拉普拉斯矩阵
求解
最小化 Ncut 等价于求拉普拉斯矩阵的最小特征值对应的特征向量,然后用 K-means 聚类。