主成份分析:
主成份分析是最经典的基于线性分类的分类系统。这个分类系统的最大特点就是利用线性拟合的思路把分布在多个维度的高维数据投射到几个轴上。如果每个样本只有两个数据变量,这种拟合就是 其中和分别是样本的两个变量,而和则被称为loading,计算出的P值就被称为主成份。实际上,当一个样本只有两个变量的时候,主成份分析本质上就是做一个线性回归。公式本质上就是一条直线。
插入一幅图(主成份坐标旋转图,来自:PLS工具箱参考手册)
如果一个样本有n个变量,那主成份就变为:
其中PC1 称为第一主成份,而且,我们还可以获得一系列与PC这个直线正交的其它轴,如:
被称为第二主成份
以此类