40:21 (1.3X)

李坏_品职助教 · 2025年02月09日
嗨,从没放弃的小努力你好:
PCA的全称是主成分分析,其目的是让降低维度之后的数据的离散程度尽可能大(这样才能尽可能多保留信息)。
假设原始数据是红色椭圆形表示的数据集,原始坐标是(X1,X2),PCA会先把坐标旋转成蓝色的,这样你把红色椭圆映射到蓝色的坐标轴上会发现,数据比红色坐标轴的离散度更大。
两条蓝色的新坐标轴,就是我们得到的两个主成分PCA1和PCA2,蓝色坐标轴上任意一点都可以表示为原始坐标轴(X1,X2)的线性组合,所以PCA1 = w1x1 + w2x2,这个意思是,x1和x2可以线性组合成PCA1。同样的,x1和x2也可以线性组合成PCA2.
反过来,我也可以用PCA1和PCA2线性组合成X1以及X2。过程比较繁琐,不要求你掌握,我大概写一下:
PCA1 = w1x1 + w2x2
PCA2 = w3x1 + w4x2
方程可以写成矩阵形式:
设矩阵W为:
W的逆矩阵:
所以:
展开得到:
老师课上是把这个复杂的过程省略,直接给出结论。a11 =w4/(w1w4 - w2w3),a12= -w2 / (w1w4 - w2w3)
----------------------------------------------
就算太阳没有迎着我们而来,我们正在朝着它而去,加油!