一個矩陣X,為什麼X * Xt 表示列與列之間的相似性,Xt * X表示數據之間的相似性?
12-28
不是很理解:
為什麼X * Xt (X的轉置矩陣)表示列與列之間的相似性,Xt * X表示數據之間的相似性是因為X * Xt正比於列與列之間的cosin?
題主對列和行的理解 和 我有點差異,也許題主是台灣人。
這裡我們不如用column和row稱呼,避免歧義。
如果,則稱作各個row之間的內積矩陣,而稱作各個column之間的內積矩陣。
題目中的兩個乘積都是指內積矩陣,所以題主真正想問的問題是『內積為什麼可以表示相似性』。
其實不是『內積』表示相似性,而是『內積』誘導出『範數』,『範數』誘導出『度量』,也就是空間中的距離,因此規定了內積,可以幫助求出距離,也就是通常意義上空間中的相似性。
我覺得題主想問的矩陣有兩點沒表述清楚吧:
1. 矩陣是隨機向量的若干次觀測,每一行是一次觀測。(可能規定不一樣,每一列是一個觀測)
2. 數據要做標準化,要不然尺度不一樣,就無法比較相似性了。
如果以上兩點滿足,一個是內積矩陣(也就是說的cosine),一個是協方差矩陣。所以一個代表行(每一次觀測,或者說數據)的相似性,一個代表列(隨機向量的分量)的關聯性。
推薦閱讀:
※arctan1/2+arctan1/2^2+arctan1/2^3+·······+arctan1/2^n+·······這個級數的收斂性是什麼,若收斂求和又是什麼?
※tan(1)+tan(2)+tan(3).....是否收斂?如何求和?
※矩陣運算和普通運算很相似,如I*1,O*0,那麼矩陣是否有類似e的表示?
※矩陣的列變換代表的意義?
※矩陣求導能否使用鏈式法則?維基百科上這句是啥意思