關於超平面的疑問?
02-06
分隔超平面的形式可以寫 w^T * x + b 為什麼可以寫成這種形式呢?? 這個怎麼就構成了一個平面呢? w是什麼, x是什麼, b是什麼呢?? 我實在想不出來, 剛剛接觸麻煩多指教
說實話,這個比較基礎,放在教科書里都不會解釋的那種,但是要嚴謹的解釋起來又很麻煩,涉及到線性子空間和維度。說個簡單的容易理解的:
超平面在二維空間里就是直線,方程是a*x+b*y+c=0
超平面在三維空間里就是平面,方程是a*x+b*y+c*z+d=0在n維空間里推廣就是就是a*x+b*y+c*z+........+k=0這裡的(a,b,c...)就是向量w,是由平面確定的數,(x,y,z..)是平面上任一點的坐標,就是你方程里的x,也是一個向量。我猜你沒學過線性代數,這個還是非常非常基礎的,你還是先把線性代數學一遍比較好。
維基百科裡面的解釋是In geometry a hyperplane is a subspace of one dimension less than its ambient space.
也就是說在N維的環繞空間ambient space中,維度為N-1的次空間都是超平面。在二位空間中就是直線,三維空間中就是平面。至於為什麼單詞裡面有個plane,我覺得是因為現實中能夠表現出來的最高維度就是三維空間,而三位空間的超平面就是plane, normal plane.所以,四維空間裡面的超平面就是個三維平面(所謂的三維空間)。然後這裡得區分order dimension的概念,維基百科裡面的解釋是In mathematics, the dimension of a partially ordered set (poset) is the smallest number of total orders the intersection of which gives rise to the partial order.
也就是說偏序集的維數就是(對偏序有影響的)總階數的最小值。可以發現階數與維數之間沒有公式直接推導的關係。至於你題目中的間隔超平面只是個名字而已,你這個應該是pattern recognition裡面的SVM支持向量機的內容,這樣的話就是兩條基於分隔線向兩邊平移的直線。當然向量機也可以延伸到高維度,這樣就不會是條直線了。x 一組N維變數(坐標軸)
展開如下:
n=1(一維) 表示一個坐標點
n=2 表示一條線
n=3 表示一個面
......
想想三維空間中平面的方程是什麼,推廣到高維就是這個形式啦
推薦閱讀:
TAG:機器學習 |