為什麼距離(度量)要滿足三角不等式?

有什麼深刻的原因么?


首先,這是歐式空間度量的自然推廣。二維的三維的是這樣,我們認為度量都應該這樣,這是數學中常見的抽象方法:把本質的性質提煉出來當做定義,原來的常見的結果對抽象的一類東西都可以用了。群、線性空間等定義都是這麼定義的。

其次一點我認為比較有用的,也是上面的回答沒有提到的,就是在數學證明過程中經常需要這一條。最顯著的就是分析中常用的逼近技巧,先證明對好的函數成立,對一般的函數用好的函數去逼近結論也成立,這就需要三角不等式來控制誤差。這種方法在實分析,泛函分析,方程,調和分析中都特別常見,是標準的技術。


這一條是我們從日常語言的「距離」中抽象出來的一條屬性,不是刻意這麼定義的。


因為要講邏輯,要適用於自然界,要符合我們日常所見的二維空間和三維空間,簡單地講,一個度量空間要被人們所接受才能稱之為well-defined。

三角不等式的本質其實就是為了說明"直路比彎路短"這一事實。


三角不等式最重要的一點在於將不同的點與它們的距離聯繫在一起。如果僅滿足正定性和對稱性,我們甚至都沒法保證兩個球的交中間可以有一個小球。這將導致距離無法在X上誘導一個拓撲,自然也無法研究與距離相關的極限和連續,那麼我們要它何用。


不滿足三角不等式的叫實正值函數括弧名字瞎起的


不好意思,我剛才有種情況沒考慮,就是有的三元組滿足,有的不滿足的情況。如果是這樣,那麼空間mathcal{X}可以是非平凡的。例如,mathbb{R}^{2}上直線全體構成的空間,以歐式距離誘導的集合間距離為度量,這個空間在平行直線間滿足三角形不等式,若取三條直線有且只有兩條平行,就會出現反三角形不等式。

因為這樣的空間很平凡。

首先我們假設空間mathcal X上的度量滿足,

1. 正定性

d(x,y)ge0, forall x,yinmathcal X.

2. 同時性

d(x,y)=0Leftrightarrow x=y, forall x,yinmathcal{X}.

3. 對稱性

d(x,y)=d(y,x), forall x,yinmathcal{X}.

4. 反三角不等式

d(x,y)>d(x,z)+d(z,y), forall x,y,zinmathcal{X}

則,令x=y=z,

d(x,x)>2d(x,x)Rightarrow d(x,x)<0,

同時性矛盾,故這樣的空間mathcal{X}=emptyset.

現在我們把條件4.變弱,反三角不等式三個變數必須不全相等

d(x,y)>d(x,z)+d(z,y),forall x<br />
eq y,or,y<br />
eq z,or,z<br />
eq x.

則令z=y, 有d(x,y)>d(y,x),對稱性矛盾。故空間mathcal{X}=emptyset.

下面繼續把條件4.變弱,反三角不等式三個變數必須互不相等

d(x,y)>d(x,z)+d(z,y), forall x<br />
eq y,and, y<br />
eq z, and, z<br />
eq x.

d(y,z)>d(x,y)+d(x,z), 從而 d(x,y)>d(x,y)+2d(x,z),

因此 d(x,z)<0,正定性矛盾。故空間mathcal{X}=emptyset.


我覺得最關鍵的是要捕捉到微分學建立和極限之間密不可分的關係。 仔細想想,極限的唯一性是依賴於三角不等關係的。 所以一旦沒有三角不等關係,沒有極限的唯一性,就沒辦法建立我們的歐氏微分學


目前我們使用的距離(度量)都是滿足三角不等式,在傳統的教材裡面距離度量的定義就是需要滿足四個條件:非負性,對稱性, 不可區分之同一性 (identity of indiscernibles),和三角不等式,這樣的度量的物理意義很簡單明了,大家都可以接受。

在機器學習裡面的度量學習中,identity of indiscernibles這一條不成立了(當矩陣是半定的時候),我們也默認稱之為度量學習,只是不是傳統意義上我們定義的度量。

所以,我認為只要你能找到一種度量或者距離,它能擁有物理意義,大家都可以接受,也可以不滿足三角不等式,關鍵看能否能解釋清楚,有意義價值。


推薦閱讀:

比「億」大的計數單位是什麼?
為什麼世界上只有美國等幾個國家在使用華氏度?

TAG:數學 | 機器學習 | 度量單位 |