對稱矩陣對角化的意義何在??

現在在看線性代數中的對稱矩陣對角化,看計算都覺得複雜,不明白這樣對角化的意義何在,書本也未作說明。。。我個人習慣是知道學了有什麼用,才比較有興趣去學的。

所以想問問,對稱矩陣對角化在線性代數研究、工程計算方面(好像結構動力學計算有用到)或者其他理論研究方面的實際意義是什麼?這樣對角化有什麼優點??

先行感謝各位大神的回答。


謝邀。

首先對稱矩陣和二次型是一回事。簡單來說,只要是見到二次型的地方我們就會想把她對角化,因為對角化相當於換一個標架,這樣形式簡單嘛,而關鍵點在於,我們研究的很多性質都是無關標架的。看對角化的應用那麼只要看哪裡有二次型就好了。而另一方面,對稱矩陣和自伴運算元也是一回事,不過一般說自伴運算元都是在無窮維的Hilbert空間里,對角化的推廣就是譜分解,這件事情就不知道說不說得清了。。

先說幾個簡單的碰得到二次型的地方:

  1. 二次曲線or曲面的分類

    這件事情應該是在解析幾何課上會講到的,但是不知道高數里講不講。比如二維的二次曲線:

    Ax^2+2Bxy+Cy^2+Dx+Ey+F=0

    我們知道二維的非退化的二次曲線有橢圓,拋物線和雙曲線,那麼問題來了:什麼時候上面的曲線是退化的?什麼時候代表橢圓、雙曲線或者拋物線?如果這條曲線的形狀知道了,那麼幾何量(如橢圓的長軸短軸焦距,雙曲線的實軸虛軸焦距,拋物線的焦點準線)各是多少?這些一定要去做對角化的。

    三維也是一樣,三維空間的二次曲面類型就更多了,什麼錐面、雙曲拋物面、橢圓拋物面、單葉雙曲面、雙葉雙曲面、橢球面……反正是類似的做就好了
  2. 轉動慣量矩陣

    依稀記得一個剛體的轉動慣量是一個矩陣,然後可以通過對角化找到慣量主軸和主轉動慣量。我力學特別爛,相信題主的力學肯定比我好。
  3. 二階PDE的分類

    其實和二次曲面那個差不多,因為二階PDE也就是上面那樣的一個形式,而不同點在於上面的係數都是常數,但是在PDE裡面係數可以是函數。所以給一個二階PDE都可以相應的化成標準形式,再去分類,比如說分成橢圓型的拋物型的還有雙曲型的。這個分類的意義在於,不同類型的二階PDE性質差別非常大,橢圓的是極好的,比如調和方程,可以有regularity,還有極值原理對吧;拋物型的,比如熱方程,也很好;而雙曲型的就呵呵了,比如可能會有一個曲面讓這個二次型全部退化掉,在這上面就會出現間斷。

說個稍微麻煩一點的,Morse theory. 簡單來說,就是通過manifold上面的Morse function去看她的拓撲性質。所謂Morse function,簡單來說就是導數等於0的點二階導不等於0,而因為是高維的情形嘛,所以就變成了Jacobian退化的時候Hessian是非退化的,這種點叫做臨界點。在臨界點附近,可以看Taylor展開,常數項不看,一階項沒有,那麼函數就差不多是Hessian確定的那個二次型,對這個二次型做對角化,實際上也就是線性空間換一組基,就變成了

C+x_1^2+cdots+x_k^2-x_{k+1}^2-cdots-x_n^2

事實上可以做的更精細,就是在臨界點附近做一個坐標變換,讓這個函數直接等於

C+x_1^2+cdots+x_k^2-x_{k+1}^2-cdots-x_n^2

這個就是Morse"s lemma.

我們知道二次型的不變數是正負慣性指數,因為Hessian是非退化的所以這兩個知道一個就行了,就把負慣性指數叫做這個函數的index,index是多少差不多就能決定這個manifold在這個臨界點附近的形狀,而非臨界點可以直接跳過去,所以整個就清楚了大概這樣。當然這裡省略了大量細節和後續工作……

拋磚引玉~


意義是把多個耦合的變數儘可能的解耦。


個人觀點:

「分解」是科學發展史中很重要的一個思想/方法/套路。面對一個比較複雜、不好分析的對象,人們經常會採取這樣的方法:想辦法弄清楚這個對象是由哪些更基本、相對更簡單的「元素」/"元對象"以某種方式組合構成的。具體到數學中,比如一般的正整數不好研究,我們就採取這樣的觀點:把每個正整數都看做由更基本的「素數」通過「乘法」組合而成。然後我們只要專心研究素數就好了。然後從素數的研究就出來了一大堆成果。類似的例子其實非常多。比如研究函數,一般的函數性質很難刻畫啊,但我們知道多項式函數非常好、很容易研究,那麼能不能用多項式函數作為元對象研究一般函數呢?這就是泰勒展開。比如積分,從更高的觀點看的話就可以理解為是由更基本的元素「測度」按照某種加權方式(被積函數)「組合」(積分)而成。然後研究這些更基本的「測度」,就有了測度論、現代概率論等等什麼的。泛函分析里為什麼要費那麼大勁搞出來譜分解?因為它是對運算元的「分解」啊,肯定有用的。

這個思路不一定是科學家真實採用的想法,但我覺得對於初學者理解還是很有幫助的。這個過程中注意有兩個要點:一是元對象要夠基本、更容易研究,二是組合方式要合理、應用性廣、夠豐富。

所以類似地,研究矩陣的話,我們也希望採用這個思路來搞。最直觀的思路可能是把矩陣每個位置上的元素當做元對象、橫豎排列方式當做其組合方式。但這思路是有缺點的,因為「橫豎排列方式」不是個應用性廣、夠豐富的組合方式,並且也不屬於傳統的數學組合方式(初等代數運算、微分積分等)之中,既陌生又沒搞頭,所以沒人採用這種方式對矩陣「分解」。(另:或者你把矩陣的分塊看成這種思路的產物也可以。但分塊最常見的用途是使得矩陣的一些表達比較方便,似乎進一步的發展不是足夠豐富)

後來人們發現,矩陣的乘法很常用,很重要。(事實上這是有原因的,因為矩陣就是線性變換的表示,矩陣乘法就對應著線性變換的複合,所以當然常用。不過一般工科生並不了解這方面的觀點,所以我就不多談這個角度了)那麼,能不能從矩陣乘法入手搞一個分解呢?最後出來的就是對角化分解,對角矩陣是足夠簡單了並且也比一般矩陣多出很多非常好的性質、容易研究;同時它是以矩陣乘法的方式聯繫到一般矩陣的,這也很好。

進一步的事實發展證明對角化操作很有用。最基本的,你想算一個方陣A的n次冪,用對角化容易多了吧?你會問算個冪有什麼了不起?這用處就大了,有了A的n次冪我們就可以有關於A的函數的多項式展開啊!而利用多項式展開又可以反過來定義一些矩陣函數啊!(比如exp^A, sinA)等等等等吧,總之好處很多。其中的原因都可以歸為上述兩條:對角矩陣性質太好太容易研究發展了,而矩陣乘法又太重要太常見。


工程力學狗來提一下對稱矩陣對角化在連續介質力學中的應用

本人數學和力學學的都不算太好,當年線代也是稀里糊塗,學完就忘,大三再學彈性力學時用了很多線代的知識重新複習才找到了點豁然開朗的感覺,以下都是個人的一些比較粗淺的想法和觀點,分享一下,拋磚引玉。如有不嚴謹之處還請指正。

首先來引入應力的概念:

物體由於外因(受力、濕度、溫度場變化等)而變形時,在物體內各部分之間產生相互作用的內力,以抵抗這種外因的作用,並試圖使物體從變形後的位置恢復到變形前的位置。

在所考察的截面某一點單位面積上的內力稱為應力。同截面垂直的稱為正應力或法嚮應力,同截面相切的稱為剪應力或切應力

(自百度百科)

正應力的典型例子是在一個受拉力的圓軸上(如圖),在一個兩端受拉力的圓軸上取一個垂直於軸線的截面,認為截面上均勻分布著內力,內力大小等於外力F,由靜力平衡條件,有此處的正應力sigma =Fdiv A,A為圓截面面積。應力的量綱為牛每米方,故單位與壓強相同,為帕斯卡(Pa)

切應力的典例為受扭矩的圓軸,問題如圖,

推導可參考材料力學教材,結論是,當圓軸受扭轉時,其垂直軸線的圓截面上的分布有隨半徑線性變化的作用於圓截面內的切應力,如圖,切應力用符號	au 來表示。

以上兩種都是簡單的單一應力狀態,顯然外力是可以共同作用的,若一根桿受扭矩和拉力,那麼在橫截面上就會出現正應力和切應力組合的情況。我們以垂直橫截面的方向為X軸,建立空間直角坐標系,可以把橫截面上的應力分解為

以數學來看,這是一個矢量,即一個面上的應力矢量,它表徵了某一個截面微元上的應力狀態

對於一些簡單的問題,以上分析就足夠了,因為他們都可以簡單的把問題變為一種平面內的問題,通過一個面內的應力矢量確定應力狀態,分析結構剛度(變形大小)和強度(是否發生破壞),但對於複雜的結構問題,必須討論一點處的應力狀態

連續介質力學的研究方法來自微積分,求解過程使用的是數個微分方程的聯立,所以最基本的方法是在複雜的應力的實體中取一個無限小的微元體,進行分析,研究其上的應力狀態,如圖:

即,一個無限小的微元體上的應力狀態,或者,一點處的應力狀態,在直角坐標下,可以用在三個正交平面上作用的應力矢量來表達。可以用9個分量來表達。

回想一下高中學過的矢量的問題,速度矢量的分量v_{x} v_{y} , v_{z} 一起才可以表達物體運動的速度矢量V。這裡也一樣,9個標量和起來才能表達一點處的應力狀態,所以把這9個量和在一起,表述為一個量,怎麼做呢?前人把這9個量和在一起,寫成矩陣的形式,叫做應力張量:(注意張量並不等價矩陣,下面會提到)

其中元素下標的第一個字母表示表示應力分量所在面垂直的坐標軸,第二個字母標識應力分量的方向與某一個坐標軸的方向平行。如	au _{xy} 就表示作用在垂直於x軸的面上,與y軸方向平行的應力分量。

值得注意的是,當物理受外力後處於平衡狀態的時候,這個矩陣其實是天生的實對稱矩陣,即	au _{ij} =	au _{ji} ,力學上稱為切應力互等定理,由微元體的靜力平衡條件的力矩平衡直接得到。相關推導可以參考材料力學的教材。

現在,我們得到了一個實對稱矩陣來表達物體一點處的應力狀態,線代告訴我們這玩意一定可以化為一個對角化為一個對角矩陣。但這玩意有什麼意義?變換用的正交矩陣Q又是嘛玩意?

答案很簡單:坐標變換

這個「左乘Q的轉置、右乘Q」的正交矩陣Q就是坐標變換矩陣,我學後扔了快兩年了記得不太清楚了,大部分線代教材上在向量組和向量空間的章節應該都有描述,大家可以自己參考。

對比上面應力張量的表達,顯然,一點處由9個量表達的應力狀態(對稱矩陣)通過坐標變換可以用三個正交面上的正應力(對角陣)來表達,如圖所示(直接從我們教學資料上拍了一張= =):(材料力學中沒有直接給出變換矩陣這個概念,但有一個叫應力圓的概念,表達的是同樣的意思)

這個轉換後的坐標系就叫主坐標系,三個正應力叫做主應力(其實就是線代里所說的特徵值lambda )。

那麼求出主應力有什麼用呢?

需要注意,坐標轉換前後的兩個矩陣表達的是同一點處的同一個應力狀態(或者說,表達的是同一個張量),後者的形式更為簡潔,可以更清晰的體現一點的應力狀態,分析複雜應力狀態下的強度判據的四大強度理論就大多需要用主應力為判斷準則。一般應力狀態是通過建系,假設,列微分方程聯立求得的(絕大多數都很難得到準確的解析解,現在多使用有限元等計算機數值方法),這就導致一般解出的應力分布是9個分量表達的一般形式,需要使用坐標變換變為主應力的形式來校核強度。

以上

P.S

提到的幾門課中,材料力學是彈性力學的先修課程,大部分學機械的工科生都需要接觸這門課,以理論力學的靜力分析和高數為先修課程。 在大量簡化的基礎上討論棒類物體的受力、變形、穩定性和破壞極限問題。

彈性力學的研究對象彈性體結構的受力、變形與其間的對應關係。這裡只是為了講明矩陣對角化的應用只淺談里應力狀態相關的部分內容。一般好像只有學土木和結構的同學會接觸。

參考資料:

楊桂通. 彈性力學,高等教育出版社

單輝祖,材料力學,高等教育出版社


前面已經有人提到了量子力學,我就來多講講吧

對於一個算符A,我們有

A|alpha_i>=alpha_i|alpha_i>

我們值得,特徵向量可以使得矩陣對角化,那麼我們的算符可以表示為

A = sum alpha_i|alpha_i><alpha_i|

我們可以得到這個算符在測量時塌縮到某態的概率是

|<alpha|psi>|^2

基於此的量子力學中對角化應用很多。


我覺得可以這樣理解。

對角方陣(diagonal square matrix)是最好的矩陣之一

  • 給出一個滿秩的對角方陣,我們可以一眼看出它的特徵值,特徵向量,逆矩陣,行列式的值,跡等等重要的特性。

  • 對角方陣表徵線性變換時,這個變換是解耦的,在二維和三維,其幾何意義更是顯而易見的。
  • 等等。

因此,人們更願意去處理對角方陣。

因此,人們千方百計的把一些不好的矩陣變成好的矩陣。這也就是各種對角化方法的意義。


結構工程師的角度簡單回答一下,結構自振方程M×Z""+C×Z"+K×Z=0,不考慮阻尼求解自由振動方程(K-w^2M)Z=0,為了求得特徵值以及特徵向量,最基本方法的就是|K-w^2M|=0,四次以上就沒法用多項式求解了。這個時候我們就可以採用兩類方法:第一類直接法,第二大類間接法求解(逆迭代法,子空間法,利茲向量法,lanzos法等等)。

第一類就是把特徵值問題通過jacobi對角轉換求得標準特徵值,還用一種QR法。

結構工程或者工程中更多碰到的是稀疏矩陣的特徵值問題,而且用到的一般是低階特徵值,所以工程有限元(FEM)更多採用高效的ritz,lanzos、子空間等等,這些方法作用後的低階矩陣的往往採用逆迭代法或者jacobi法。


受前面的回答啟發,總結下對角矩陣處理起來的方便之處: 1.兩個同階對角矩陣的乘積就是相應的對角元相乘。 2.對角矩陣的n次冪只需把相應的對角元取n次冪即可。 3.求對角矩陣的逆矩陣,只需把矩陣的所有對角元取倒數即可。 4。對角矩陣的行列式的值為其對角元的乘積。5。對角矩陣的特徵值為其各個對角元。當然我們並不能直接用相似對角矩陣來直接代替原矩陣來進行計算,但是往往原矩陣的很多運算是可以利用其相似對角矩陣來化簡的,比如求矩陣的n次冪。實際應用中,相似對角化在:工程力學,理論力學中也應用廣泛。


作為學渣,我只知道:對角化之後可以大大的簡化計算。

試想原本你計算一個n階矩陣的很多次方,那麼每次算新的矩陣的一個元素都要算n次乘法再相加,累死了吧?

可是對角化後就再作n次方就簡單了太多,兩三步得到結果。


不是很清楚在工程方面的應用。但是剛剛學了理論力學感覺有一點想法。經典力學裡面的慣量矩陣排名第一的答案也有提到啦。大概就是慣量張量本來是一個對稱陣,對角化之後對角元為主慣量,每個主慣量是剛體對應一個慣量主軸的慣量,這樣變換之後不同坐標的各種量就分開啦,你可以單獨算動能呀之類的。

所以嘛,我覺得,對角化變成標準二次型之後,就好像減少了不同坐標的交叉項,把不同坐標分開之後各種運算都簡便了不少。而且使對稱陣對角化一定是正交變換,所以各種性質保持,可是用起來方便多啦。

前面的答案都好厲害的樣子。果然只有到了要講的時候才發現自己多學渣(╯﹏╰)


回答中有幾個人提到了PCA(主成分分析principle component analyse),但我覺得應該展開具體講一下。非常簡單,一看便知。

「PCA是通過線性變換降維的」。但是降維不是隨意降的,而是在最大程度上保持原有矩陣的性質的降維,即原始數據不要失真。

如何理解這句話?

因為原始矩陣是有雜訊的,何為雜訊?就像線性相關的矩陣,我們計算時會用其極大線性無關組來計算,那些被化簡的,就是雜訊。還有一些向量,其方差比較小,即波動比較小,不能夠很好的反映樣本的特性,也會被去除。

通過什麼去除呢?

協方差矩陣。

協方差矩陣度量的就是維度和維度之間的關係。協方差矩陣主對角線上的元素就是各個維度上的方差,非主對角線上元素是各維度之間的相關性(協方差)。我們的目的還記得嗎?就是讓不同維度間的相關性儘可能的小,所以,就可以轉化為如何讓協方差矩陣非對角線元素儘可能為零,要達到這個目的,就要進行矩陣對角化

---------------------------------------------公式推導分割線--------------------------------------

還有興趣的寶寶,兩分鐘看一下PCA公式推導會理解的更深刻


如果把矩陣看成一個向量組的話,對角矩陣里的向量都是相互垂直的。並且每一個向量只有一個方向上的長度不為0,其他方向上的向量都為0。像什麼?太像坐標軸了。而且是標準的坐標軸。我認為,這是對角化的根本意義所在。


PCA(主成分分析),DOA(波達定位)等技術都會用到矩陣對角化,具體會用到Jacobi、QR等方法做特徵分解


說說運動學方面的物理意義吧

一般運動學方程中都會有,位移,速度,加速度,分別跟能量 阻尼還有受力有關。

對於自由度為1的系統這是一個一元二次微分方程。

如果自由度為N,那麼這就是一個N元二次微分方程(N個等式,N*N矩陣)。這是非常難以求解的。

但是對角化矩陣,可以把N元方程轉化為N個一元方程,這是利用了特徵向量與特徵值的特性所得到的。

一元二次微風方程的解的形式是固定的,此時只要引入臨界條件就可以求接觸出具體數值。

另外,使用對角化矩陣運算時可以大量簡化運算的,對於一個自由度較龐大的系統,實用矩陣可以大大提高運算速度同時降低對運算伺服器的硬體要求,是非常必要的處理問題的手段。


在資訊理論中。對角化可以解除頻域相關性。將信息映射到n維坐標軸下。每個軸上帶有一個頻域權值。他們之間相互正交

對角化可以將二次型化為標準式,即只有平方向


求特徵向量和特徵值

如果是應力矩陣 那麼求的就是主應力大小和方向 三個沒有切應力的正交面

如果是剛度陣 那麼求的就是自振頻率和振型

力學狗只懂這些 獻醜了


我個人感覺對稱矩陣對角化就是把這個變化中拉伸的變化與旋轉的變化分離出來,特徵值就是他各個坐標軸被拉伸的量

拉伸量比較重要,旋轉不是件很重要的事,包括後面的二次型標準化也就是保留主要的拉伸部分

對稱是為了保證這個變化是可以分離的,不會塌縮


這個矩陣自乘只要把對角線上的數自乘就可以了,不對角化還要第一行乘第一列後再第二行乘第二列什麼的加一起

另外對角化之前的函數可能是x2+2xy+x2

在這個坐標中x和y有關聯,對角化後就沒關聯了


電力系統中的相模變換!


建議從抽象代數角度思考 對角化就如同把n階矩陣集合分解成n+1個等價類 對角化之後的矩陣就相當於在對角化之前的矩陣所在的等價類之中找到了一個直觀而好用的代表元 這個代表元要比對角化之前的矩陣好用的多


量子力學裡面對角化很重要。

算符的矩陣表示對角化,意味著切換到算符對應表象下,直接可以得出對該力學量進行測量能夠得到的值

密度矩陣的對角化,可以看出該系統處於純態還是混態,以及其處於不同態的經典概率,而且只有對角化了才能夠直接求該系統的熵。


推薦閱讀:

求特徵值是習慣用 |λE-A|=0 還是用|A-λE|=0的形式?
單擺問題の近似解
把機械系統抽象為程序或數學函數,它是否可以完成所有的初等函數?
預備篇:纖維叢上的聯絡(下)
微積分的歷史(三),起源之萊布尼茲

TAG:數學 | 土木工程 | 線性代數 | 結構工程 |