一個矩陣X，為什麼X * Xt 表示列與列之間的相似性，Xt * X表示數據之間的相似性？

12-28

不是很理解：
為什麼X * Xt （X的轉置矩陣）表示列與列之間的相似性，Xt * X表示數據之間的相似性

是因為X * Xt正比於列與列之間的cosin？

題主對列和行的理解和我有點差異，也許題主是台灣人。

這裡我們不如用column和row稱呼，避免歧義。
如果 $Xin R^{n imes m}$ ，則 $XX^Tin R^{n imes n}$ 稱作各個row之間的內積矩陣，而 $X^TXin R^{m imes m}$ 稱作各個column之間的內積矩陣。

題目中的兩個乘積都是指內積矩陣，所以題主真正想問的問題是『內積為什麼可以表示相似性』。

其實不是『內積』表示相似性，而是『內積』誘導出『範數』，『範數』誘導出『度量』，也就是空間中的距離，因此規定了內積，可以幫助求出距離，也就是通常意義上空間中的相似性。

我覺得題主想問的矩陣有兩點沒表述清楚吧：
1. 矩陣是隨機向量的若干次觀測，每一行是一次觀測。(可能規定不一樣，每一列是一個觀測)
2. 數據要做標準化，要不然尺度不一樣，就無法比較相似性了。

如果以上兩點滿足，一個是內積矩陣(也就是說的cosine)，一個是協方差矩陣。所以一個代表行(每一次觀測，或者說數據)的相似性，一個代表列(隨機向量的分量)的關聯性。