矩陣乘法為什麼那樣定義?不要用結果現象當作原因來回答!?
01-29
緣由來自,昨天在看可汗學院里的矩陣乘法,視頻里說到(字幕),這是對矩陣乘法的人為定義,你完全可以使用其他方法,但是我們建議你使用這種方法。
這是一個很有意思的問題。從我的個人理解上來說,它可能涉及到更高深的東西(張量),但是我盡量用簡單的語言來回答。
首先,從一個數,即一個標量,開始思考。這個數所在空間上的線性映射
應該是怎麼樣的呢?很顯然,它只能表示為.(證明方法先考慮f(1), 然後利用齊次性。) 也就是說,在實數上的所有線性映射都是的形式。並且兩個線性映射的複合是.
現在讓我們走到考慮更高維的空間。那麼在這個空間上的線性映射,更準確地說是線性函數又應該是怎樣的呢?里斯表示定理告訴我們,,其中這裡的表示內積。如果我們寫成線性代數中的通常形式,那就是
即傳說中「的一行乘以一列」。既然如此,如果我們考慮線性映射呢?根據定義,如果我們將寫成分量形式,那麼每個分量都是一個線性函數。根據上面的理論,我們知道,其中
A的每一行是向量,並且它和的運算是內積運算。我們就稱這樣的為矩陣,並且與的乘法運算就是傳說中的「一行乘以一列」。【注意這裡的乘法是有順序的】現在我們就來看矩陣的乘法運算。我們考慮兩個線性映射的複合。顯然它等於. 如果我們期待運算具有結合律的話,那就是. 從而我們得到了矩陣乘法的定義,也就是傳說中的「一行乘以一列」。(讀者可親自驗證,即將取成空間中的基向量。)
當然為了敘述方便,上面的線性映射都是從到的,即矩陣均為方陣。如果線性映射是從任意到,我們也可以進行同樣的方法研究。我想這就是矩陣乘法的來源之一。當然我們還可以從線性變換,而不是用映射的複合入手,思路相似。在此不作贅述。推薦閱讀: