一個矩陣X,為什麼X * Xt 表示列與列之間的相似性,Xt * X表示數據之間的相似性?

不是很理解:
為什麼X * Xt (X的轉置矩陣)表示列與列之間的相似性,Xt * X表示數據之間的相似性

是因為X * Xt正比於列與列之間的cosin?


題主對列和行的理解 和 我有點差異,也許題主是台灣人。

這裡我們不如用column和row稱呼,避免歧義。
如果Xin R^{n	imes m},則XX^Tin R^{n	imes n}稱作各個row之間的內積矩陣,而X^TXin R^{m	imes m}稱作各個column之間的內積矩陣。

題目中的兩個乘積都是指內積矩陣,所以題主真正想問的問題是『內積為什麼可以表示相似性』。

其實不是『內積』表示相似性,而是『內積』誘導出『範數』,『範數』誘導出『度量』,也就是空間中的距離,因此規定了內積,可以幫助求出距離,也就是通常意義上空間中的相似性。


我覺得題主想問的矩陣有兩點沒表述清楚吧:
1. 矩陣是隨機向量的若干次觀測,每一行是一次觀測。(可能規定不一樣,每一列是一個觀測)
2. 數據要做標準化,要不然尺度不一樣,就無法比較相似性了。

如果以上兩點滿足,一個是內積矩陣(也就是說的cosine),一個是協方差矩陣。所以一個代表行(每一次觀測,或者說數據)的相似性,一個代表列(隨機向量的分量)的關聯性。


推薦閱讀:

arctan1/2+arctan1/2^2+arctan1/2^3+·······+arctan1/2^n+·······這個級數的收斂性是什麼,若收斂求和又是什麼?
tan(1)+tan(2)+tan(3).....是否收斂?如何求和?
矩陣運算和普通運算很相似,如I*1,O*0,那麼矩陣是否有類似e的表示?
矩陣的列變換代表的意義?
矩陣求導能否使用鏈式法則?維基百科上這句是啥意思

TAG:線性代數 | 矩陣運算 | 高等數學 | 矩陣 |