標籤:

關於超平面的疑問?

分隔超平面的形式可以寫 w^T * x + b 為什麼可以寫成這種形式呢?? 這個怎麼就構成了一個平面呢? w是什麼, x是什麼, b是什麼呢?? 我實在想不出來, 剛剛接觸麻煩多指教


說實話,這個比較基礎,放在教科書里都不會解釋的那種,但是要嚴謹的解釋起來又很麻煩,涉及到線性子空間和維度。

說個簡單的容易理解的:

超平面在二維空間里就是直線,方程是a*x+b*y+c=0

超平面在三維空間里就是平面,方程是a*x+b*y+c*z+d=0

在n維空間里推廣就是就是a*x+b*y+c*z+........+k=0

這裡的(a,b,c...)就是向量w,是由平面確定的數,(x,y,z..)是平面上任一點的坐標,就是你方程里的x,也是一個向量。

我猜你沒學過線性代數,這個還是非常非常基礎的,你還是先把線性代數學一遍比較好。


維基百科裡面的解釋是In geometry a hyperplane is a subspace of one dimension less than its ambient space.

也就是說在N維的環繞空間ambient space中,維度為N-1的次空間都是超平面。在二位空間中就是直線,三維空間中就是平面。

至於為什麼單詞裡面有個plane,我覺得是因為現實中能夠表現出來的最高維度就是三維空間,而三位空間的超平面就是plane, normal plane.

所以,四維空間裡面的超平面就是個三維平面(所謂的三維空間)。

然後這裡得區分order dimension的概念,維基百科裡面的解釋是In mathematics, the dimension of a partially ordered set (poset) is the smallest number of total orders the intersection of which gives rise to the partial order.

也就是說偏序集的維數就是(對偏序有影響的)總階數的最小值。

可以發現階數與維數之間沒有公式直接推導的關係。

至於你題目中的間隔超平面只是個名字而已,你這個應該是pattern recognition裡面的SVM支持向量機的內容,這樣的話就是兩條基於分隔線向兩邊平移的直線。

當然向量機也可以延伸到高維度,這樣就不會是條直線了。


omega 表示一組係數(向量) omega^T 表示這組係數(向量)的轉置

x 一組N維變數(坐標軸)

展開如下:

omega^T*x +b = omega_1*x_1+w_2*x_2+...+omega_n*x_n + b = 0

n=1(一維) 表示一個坐標點

n=2 表示一條線

n=3 表示一個面

......


想想三維空間中平面的方程是什麼,推廣到高維就是這個形式啦


推薦閱讀:

TAG:機器學習 |