如何形象地理解矩陣的相似與合同?

相似的兩個矩陣有啥聯繫?合同的矩陣有有啥聯繫?


什麼是矩陣相似呢?從定義角度就是:存在可逆矩陣P滿足B=P^{-1} AP,則我們說A和B是相似的。首先,讓我們來回顧一下之前得出的重要結論:對於同一個線性空間,可以用兩組不同的基[alpha ]和基[eta ]來描述,他們之間的過渡關係是這樣的:[eta ]=[alpha ]P,而對應坐標之間的過渡關係是這樣的:x_{2}=P^{-1}x_{1} 。其中P是可逆矩陣,可逆的意義是我們能變換過去也要能變換回來,這一點很重要。

我們知道,對於一個線性變換,只要你選定一組基,那麼就可以用一個矩陣T1來描述這個線性變換。換一組基,就得到另一個不同的矩陣T2(之所以會不同,是因為選定了不同的基,也就是選定了不同的坐標系)。所有這些矩陣都是這同一個線性變換的描述,但又都不是線性變換本身。具體來說,有一個線性變換x_{1}
ightarrow y_{1} ,我們選擇基[alpha ]來描述,對應矩陣是T1;同樣的道理,我們選擇基[eta ]來描述x_{2}
ightarrow y_{2} ,,對應矩陣是T2;我們知道基[alpha ]和基[eta ]是有聯繫的,那麼他們之間的變換T1T2有沒有聯繫呢?


當然有,T1T2就是相似的關係,具體的請看下圖:

沒錯,所謂相似矩陣,就是同一個線性變換的不同基的描述矩陣。這就是相似變換的幾何意義。

這個發現太重要了。原來一族相似矩陣都是同一個線性變換的描述啊!難怪這麼重要!工科研究生課程中有矩陣論、矩陣分析等課程,其中講了各種各樣的相似變換,比如什麼相似標準型,對角化之類的內容,都要求變換以後得到的那個矩陣與先前的那個矩陣式相似的,為什麼這麼要求?因為只有這樣要求,才能保證變換前後的兩個矩陣是描述同一個線性變換的。就像信號處理(積分變換)中將信號(函數)進行拉氏變換,在複數域處理完了之後又進行拉式反變換,回到實數域一樣。信號處理中是主要是為了將複雜的卷積運算變成乘法運算。其實這樣的變換還有好多,有興趣可以看積分變換的教材。


為什麼這樣做呢?矩陣的相似變換可以把一個比較丑的矩陣變成一個比較美的矩陣,而保證這兩個矩陣都是描述了同一個線性變換。至於什麼樣的矩陣是「美」的,什麼樣的是「丑」的,我們說對角陣是美的。在線性代數中,我們會看到,如果把複雜的矩陣變換成對角矩陣,作用完了之後再變換回來,這種轉換很有用處,比如求解矩陣的n次冪!而學了矩陣論之後你會發現,矩陣的n次冪是工程中非常常見的運算。這裡順便說一句,將矩陣對角化在控制工程和機械振動領域具有將複雜方程解耦的妙用!總而言之,相似變換是為了簡化計算!


--------------------------------------------------------------------------------------------------------------------------

這是回答矩陣合同的分割線!

--------------------------------------------------------------------------------------------------------------------------


內積有很多的應用,這裡對於內積的應用不再嘮叨了。《神奇的矩陣》和《神奇的矩陣第二季》中對內積做更深入的介紹。總之,內積很重要!我們觀察內積的運算結構:對應位置的數相乘然後求和。實際過程中經常遇到每個位置數據的重要程度不同,運算的時候常常再乘一個正數然後求和,這就是所謂的加權內積,寫成公式如下:F=x ^{T}cdot Scdot y


這裡的S為對角陣,它的值表示每個位置元素所佔的比重。比如你做實驗測到了兩組向量,你想計算他們的內積。然後發現由於儀器或者其他原因,導致向量中間的數據比較準確,而兩邊的數據誤差比較大。為了保證最終結果的準確性,就可以用到上面的公式來處理。


如果你研究的問題比較複雜,向量中相鄰兩個元素之間的乘積還對結果有影響,那麼S就是三對角矩陣。如果問題更加複雜,向量中任意兩個元素之間的乘積對結果都有影響,那麼S就是一般意義上的矩陣。此時S的意義也是清楚的:主對角線上代表對應元素乘積對最終結果的影響,其他位置sij代表向量中i和j位置數據乘積對結果的影響。


當然,這種運算是一種內積運算的推廣,它將向量對應成數。就叫它雙線性型吧。當S為單位矩陣E的時候,就是通常意義下的向量內積。當S為正定矩陣時,我們依然管它叫內積,若向量xy還相同,就是馬氏距離的平方,學過數據分類的朋友對馬氏距離肯定不陌生,有關它的幾何意義可以參看《神奇的矩陣第二季》20頁。當S不是正定矩陣的時候,這種運算就不是內積,因為它不滿足內積的非負性要求,注意到若向量xy還相同就是我們常說的二次型啊對不對!


我們經常要進行相似變換,來簡化矩陣的計算,兩個雙線性型在進行相似變換前後算出的值不一樣,多少會給我們帶來麻煩。舉個例子:我們知道在力學裡面,力和位移的內積表示能量,我們換了一組基之後再計算新的力和新的位移的內積,得到了不同的能量,顯然不符合能量守恆對吧!於是我們就想找出新舊坐標系下雙線性型的關係。

對於同一個線性空間,可以用兩組不同的坐標系[alpha ][eta ]來描述雙線性型運算。為了一會公式形式上簡單,我們假設他們之間的過渡關係是這樣的:

此時,我們看到矩陣A和矩陣B是合同的關係!這回合同的意義就清楚了:原來是同一個向量雙線性運算在不同坐標系下的過渡關係啊。換句話說,無論你怎麼換坐標系,向量雙線性運算的值只差一個合同矩陣

矩陣的合同和矩陣的相似理解起來很像。我們知道相似的意義是同一個線性變換在不同坐標系下的表示,矩陣合同是說同一個向量雙線性運算在不同坐標系下的表示!這也是為什麼要在介紹二次型型之前介紹矩陣合同關係的原因。我們在這裡看一下二次型的運算:

很明顯二次型就是一種特殊的雙線性型,而對二次型進行合同變換的本質就是換了一組坐標來重新看待這個二次型。因為只是換了坐標,所以並沒有改變二次型所代表的幾何圖形。所以,原來的二次型代表橢圓合同變換之後還代表橢圓。用數學一點的語言描述這種性質就是拓撲不變性。


(敲黑板劃重點啦!!!)

最後總結一下:矩陣的相似和矩陣的合同都是由線性空間中坐標系的轉換引起的。我們在線性空間中定義矩陣和向量的乘法,並將矩陣理解成線性空間中「運動」的施加,變換坐標系之後,同一個「運動」在不同坐標系下是相似的關係。我們在線性空間中定義向量的內積(或者說雙線性型),同一個雙線性型運算在不同坐標系下相差合同矩陣。之所以要換坐標系,就是為了在最簡單的坐標系下看清問題的本質!


本文是在整理孟岩老師的《理解矩陣》和任廣千、胡翠芳老師的《線性代數的幾何意義》基礎上形成的,只是出於一種對數學的愛好!有興趣的讀者建議閱讀原文。也歡迎下載《神奇的矩陣》和《神奇的矩陣第二季》了解更多有關線性代數和矩陣的知識。


相似的矩陣是同一個線性變換在不同基下的矩陣。

合同的矩陣是同一個雙線性形在不同基下的矩陣。


矩陣的等價(只有秩相同),合同(秩和正負慣性指數相同),相似(秩,正負慣性指數,特徵值均相同)是矩陣親密關係的一步步深化。(如果所提到的這些矩陣參數都存在的話)


一 總述:
同一線性變換在不同基下的矩陣是相似的,且相似變換矩陣恰為兩組基之間的過渡矩陣;歐式空間中不同基的度量矩陣是合同的,且合同變換矩陣恰為兩組基之間的過渡矩陣;歐式空間中一對稱變換在不同標準正交基下的矩陣是正交相似的,且正交相似變換矩陣恰為兩組標準正交基之間的過渡矩陣。
二 關於化二次型為標準形:
比如原二次型的矩陣與其標準形的矩陣就是合同關係,當然,合同也是一種對角化,且用可逆線性變化X=PY化二次型為標準形求出的D即為對角矩陣,但此D≠diag(λ1....λn) ,λ1....λn為二次型的矩陣A的全部特徵值,求P和D的方法有配方法和初等變換法兩種。而用正交變換X=QY化二次型為標準形即為正交相似對角化,求出的Λ=diag(λ1...λn),λ1...λn為二次型的矩陣A的全部特徵值,求Q的方法只有正交相似對角化法一種(注意求Q時需要施密特正交單位化)。
三 聯繫
相似就是一個矩陣在同一空間中不同基之間的變換,而合同是歐式空間中不同基的度量矩陣之間的變換,由於基決定度量矩陣(度量矩陣是對稱正定的,且任意一組標準正交基的度量矩陣是E),而度量矩陣唯一決定內積( (α,β)=X^TAY=αβ^T),且正交即內積為0(即⊥),所以對於正交相似,其實就是一個矩陣在一組相互垂直的基下的變換。
四 優越性
正交相似對角化是對相似對角化的優化和升級,因為正交相似對角化用的正交變換矩陣是正交矩陣,而正交矩陣的逆即其轉置,所以很容易求正交相似變換矩陣的逆;而相似對角化用的相似變換矩陣只是可逆矩陣,其逆要另求,比如科研工作中,給的A是1000階,求相似變換矩陣P的逆,難度可想而知,所以正交相似對角化要優於相似對角化。
五 相關結論
實對稱矩陣,正交矩陣等都屬於正規矩陣的範疇,而正規矩陣必可酉對角化,所以實對稱矩陣,正交矩陣,必可對角化,且必可正交相似對角化。
六 目的
無論合同,對角化,還是正交相似對角化,目的都是為了把原來不好研究的矩陣A化為對角矩陣形式,而對角矩陣的運算和數的運算保持一致,所以用研究對角矩陣代替研究原來的矩陣就方便了很多。這種思想和泰勒變換,傅里葉變換本質是一樣的,比如泰勒展開就是因為原f(x)不好直接研究其收斂性,連續性,可微性,可積性等分析性質,所以將其轉化為泰勒展開式的形式,以便於研究其分析性質,缺點是泰勒展開是在Xo點附近展開等號才成立,所以泰勒展開是局部的性質,而且必須要求f(x)n階可導,這就導致了泰勒變換的局限性。所以我們又給出了更好的傅里葉級數展開,不再要求局部附近和n階可導,所以傅里葉變換要遠遠優於泰勒變換,但它們的目的都是一樣的,就是用新形式的函數代替原來不好直接研究的函數,以方便研究其性質。
七 例題
如圖


簡單來說,相似就是一個矩陣在不同基下的變換(同一空間)。而合同就是這個矩陣在一組相互垂直的基下的變換。所以,合同是相似的一種特殊情況。


如果假設:
1、矩陣T看作空間A和B的映射運算元(不知道運算元什麼意思自己查)
也就是TA=B

2、A和B都經過矩陣P分別映射到A"和B"。
B』=PB
A』=PA

3、A"映射到B"的運算元記作T"
TA"=B"

辣么:
T』PA=PB
辣么:
P^{-1} T
TA=B

所以
T=P^{-1} T

可以看出,T與T"描述的都是A到B的映射,只不過A和B在使用T"進行映射的時候兩個空間同時做了個一樣的變換。
A"和A是同一個空間,就是基不一樣而已。

所以這兩個矩陣是相似的,因為他們對不同形態的空間做了本質一樣的映射(基變換)。

以下是合同矩陣相關內容,分割線——————2014年11月12日 11:27:08

矩陣的合同就是特殊的相似,矩陣相似的時候,它的基,也就是Basis是可以拉伸的,但是合同不一樣,合同變換以後的基仍然規範正交,這就可以用來方便的變化你一些函數。
對於二次型來說就是合同矩陣的作用配方,你配方的時候總不能把某一個量拉伸(加倍)以後再去配方吧~那是不對的,只能讓他們表示為某幾個量的線性組合的平方。
合同變換用的是正交矩陣,詳參一些正交矩陣的資料和酉矩陣的資料吧!


A,B均為n階方陣,若存在可逆矩陣P,使B=P*(-1)AP,則A,B相似。
A,B均為n階矩陣,若存在可逆矩陣P,使B=P(T)AP,則A,B合同。

當且僅當P為正交矩陣即P*(-1)=P(T),才有矩陣相似與合同等價。
但是A,B合同,可以直接推出A,B等價。


複習考研中。。

琢磨了一下,用人類語言說一下。

假設你叔叔(你爸爸的親弟弟)家有一個弟弟。

記P為父親關係, P^{-1} 是兒子關係,A是親弟弟關係,B是表弟關係,你是x,你爸爸是Px,那麼你叔叔是APx,你弟弟是 P^{-1}APx ,也是Bx,即 Bx=P^{-1}APx 。可見A、B都表示的是弟弟關係,只是站的角度不同(親弟弟與堂弟)


相似是合同的充分條件,當矩陣P為正交陣時,相似等於合同:P^(T)AP=P^(-1)AP=Λ。


矩陣合同相當於對一個矩陣實施一系列對應的初等行列變換,相似沒有形象的理解。在使用相似更多的是定義。


推薦閱讀:

為何微積分具有如此的優越性?
無窮小量究竟是否為零?
穿過一片麥田,去撿一個最大的麥穗,且不能回頭、更換,在何處決定撿到大麥穗的可能性最大?
有哪些表述很短但你覺得很難懂的數學公式?

TAG:數學 | 線性代數 | 高等數學大學課程 |