张芷铭的个人博客

PCA 是经典无监督降维方法,通过线性变换将数据投影到新坐标系,使方差最大化。

工作原理

  1. 数据中心化:去掉每个特征的均值
  2. 协方差矩阵:计算特征间的相关性
  3. 特征分解:得到特征向量(主成分)和特征值(方差)
  4. 选择主成分:选取最大特征值对应的特征向量
  5. 投影数据:将原始数据投影到选定的主成分上

应用

  • 图像压缩
  • 特征选择
  • 数据可视化
  • 去噪处理

Comments