SVM中,高斯核為什麼會把原始維度映射到無窮多維?
01-16
SVM中,對於線性不可分的情況下,我們利用升維,把低維度映射到到維度讓數據變得「更可能線性可分」,為了避免維度爆炸,我們巧妙的運用了核函數,避免了在高維度空間的計算,而只需要在低維度空間進行計算。
對於核函數,有:多項式核高斯核:對於多項式核,我們把低維度映射到高維度,我們可以從公式中很容易的理解,但是對於高斯核,「把維度映射到無窮多維」,是如何理解的?如何看出是「無窮多維」的?為什麼更傾向於選擇高斯核,而不是多項式核?是因為在無窮多維時,數據更加線性可分?
我來回答下:1.先考慮多項式核函數(polynomial kernel)比如
- 則 將 的點映射到
2.現在分析高斯核
根據泰勒公式
那麼成立
而且維度 是無窮維。
資料
Why does the RBF (radial basis function) kernel map into infinite dimensional space?所以這樣看來 核函數是一種特殊的 多項式核。有錯誤請指正。
我還是自己寫一下我的理解吧,
對於高斯核為什麼可以將數據映射到無窮多維,我們可以從泰勒展開式的角度來解釋,首先我們要清楚,SVM中,對於維度的計算,我們可以用內積的形式,假設函數:
表示一個簡單的從二維映射到三維。則在SVM的計算中,可以表示為:再來看泰勒展開式:
所以這個無窮多項的式子正是對於的近似,所對應的映射:再來看高斯核:
將泰勒展開式帶入高斯核,我們得到了一個無窮維度的映射:那麼,對於和的內積形式符合在SVM中無窮維度下的內積計算,即高斯核將數據映射到無窮高的維度。---------------
根據網上看的資料總結的內容,跟大家分享一下。
可以看到,展開之後的特徵的長度就是無限維的
那我想請問一下,指數核函數和拉普拉斯核函數是不是也可以映射到無窮維?因為他們也是有e^x這種形式的
並沒有
推薦閱讀:
※KNN 與 SVM 的區別是什麼?
※支持向量機中的函數距離和幾何距離怎麼理解?
※支持向量機(SVM)是否適合大規模數據?
※為什麼支持向量機要用拉格朗日對偶演算法來解最大化間隔問題?