主成分分析法(PCA)推導

09-17

主成分分析法(PCA)推導

4 人贊了文章

主成分分析法(principal component analysis, PCA)是最常用的無監督高維數據降維方法之一，它旨在降維的過程中保留原數據中最重要的幾個分量，從而達到最大化原數據方差的作用。幾乎所有數據降維方面研究都要用來作為比較重要的方法。

原文: Ph0en1x Notebook

主成分分析的基本思想就是在原有樣本的n維空間內再建立一個d維線性空間，用n個標準正交基進行重新映射，然後選取其中的d個正交基進行保留，而在這d個坐標軸上的坐標值就是映射到低維後的坐標。而推導的目的就是為了確定如何確定這這d個標準正交基以及如何選取它們。就如下圖(圖片來自於網路)一樣，將二維空間內的點映射至一維空間，最終選擇較長的那條向量進行投影映射。