谱聚类是基于无向带权图的聚类方法,通过最小化归一化割(Ncut)将图分割为多个子图。适用于非凸数据集。

聚类思路对比

方法思路代表算法
Compactness类内紧凑K-means、GMM
Connectivity图连通性谱聚类

图定义

无向带权图 ,权重矩阵 ,相似度(径向核):

图割目标

定义 ,归一化割:

其中 为节点度。

矩阵形式

引入指示向量 ,目标函数:

其中:

  • :度矩阵(对角矩阵)
  • :拉普拉斯矩阵

求解

最小化 Ncut 等价于求拉普拉斯矩阵的最小特征值对应的特征向量,然后用 K-means 聚类。