二次型的意義是什麼?有什麼應用?
二次型在數學很多分支里都頻繁出現,而且在其他學科也到處可見。比如實二次型,似乎在非常多的應用中都出現過,比如優化、概率圖論、統計、機器學習、信號處理等等。
那麼,二次型在你所學的領域有什麼應用呢?
希望大家能列出二次型在自己領域內對應的具體問題,是如何求解的等等。當然,也包括在數學分支內的應用。
通過矩陣來研究二次函數(方程),這就是線性代數中二次型的重點。
1 二次函數(方程)的特點
1.1 二次函數
最簡單的一元二次函數就是:
給它增加一次項不會改變形狀:
增加常數項就更不用說了,更不會改變形狀。
1.2 二次方程
下面是一個二元二次方程:
給它增加一次項也不會改變形狀,只是看上去有些伸縮:
1.3 小結
對於二次函數或者二次方程,二次部分是主要部分,往往研究二次這部分就夠了。
2 通過矩陣來研究二次方程
因為二次函數(方程)的二次部分最重要,為了方便研究,我們把含有 個變數的二次齊次函數:
稱為二次型。
2.1 二次型矩陣
實際上我們可以通過矩陣來表示二次型:
更一般的:
可以寫成更線代的形式:
所以有下面一一對應的關係:
在線代裡面,就是通過一個對稱矩陣,去研究某個二次型。
2.2 通過矩陣來研究有什麼好處
2.2.1 圓錐曲線
我們來看下,這是一個圓:
我們來看改變一下二次型矩陣:
哈,原來橢圓和圓之間是線性關係吶(通過矩陣變換就可以從圓變為橢圓)。
繼續:
咦,雙曲線和圓之間也是線性關係。
其實圓、橢圓、雙曲線之間關係很緊密的,統稱為圓錐曲線,都是圓錐體和平面的交線:
從上面動圖可看出,一個平面在圓錐體上運動,可以得到圓、橢圓、雙曲線,這也是它們之間具有線性關係的來源(平面的運動實際上是線性的)。
2.2.2 規範化
再改變下矩陣:
這個橢圓看起來有點歪,不太好處理,我們來把它扶正,這就叫做規範化。
如果我們對矩陣有更深刻的認識,那麼要把它扶正很簡單。
往下讀之前,請先參看我在 如何理解特徵值 下的回答。
首先,矩陣代表了運動,包含:
- 旋轉
- 拉伸
- 投影
對於方陣,因為沒有維度的改變,所以就沒有投影這個運動了,只有:
- 旋轉
- 拉伸
具體到上面的矩陣:
我把這個矩陣進行特徵值分解:
注意我上面提到的正交很重要,為什麼重要,可以參看我在 如何理解特徵值 。
對於二次型矩陣,都是對稱矩陣,所以特徵值分解總可以得到正交矩陣與對角矩陣。
特徵值分解實際上就是把運動分解了:
那麼我們只需要保留拉伸部分,就相當於把矩陣扶正(圖中把各自圖形的二次型矩陣標註出來了):
所以,用二次型矩陣進行規範化是非常輕鬆的事情。
2.2.3 正定
正定是對二次函數有效的一個定義,對方程無效。
對於二次型函數, :
- ,則 為正定二次型, 為正定矩陣
- ,則 為半正定二次型, 為半正定矩陣
- ,則 為負定二次型, 為負定矩陣
- ,則 為半負定二次型, 為半負定矩陣
- 以上皆不是,就叫做不定
從圖像上看,這是正定:
半正定:
不定:
既然二次型用矩陣來表示了,那麼我們能否通過矩陣來判斷是否正定呢?
下面我分別給出了二次型的圖形,以及對應的特徵值矩陣的圖形,你可以自己動手試試(3D窗口可以通過滑鼠旋轉,方便觀察),得出自己的結論:
此處有互動內容,點擊此處前往操作。
起碼,我們可以觀察出這個結論,特徵值都大於0,則為正定矩陣。
3 總結
在很多學科里,二次型都是主要研究對象,很多問題都可以轉為二次型。線代作為一門數學工具,在二次型的研究中也發揮了很好的作用。
很多答案都已經說了「應用」了,我就來勉強說一說「意義」,當然我其實也不太懂,只是把一些思考擺出來,權當拋磚引玉了。
(注意:按照我的一貫風格,下面與問題無關的廢話相當多)
以前我也跟同學討論過類似的問題:線性代數為什麼要學二次型這種東西?一般而言,一本相對基礎而又相對完整的線性代數教材至少會包含以下內容:線性空間和線性映射的基本性質、線性運算元的標準型、二次型和雙線性型理論;第一部分為基礎,後兩部分相對獨立。第一部分是明確了我們所研究的範疇,那麼為什麼有後面兩個部分?
我覺得這可能是一種研究「幾何」的動機。第一部分至多提供了一個「純粹的線性空間」的幾何,我們能夠對一個什麼都沒有的線性空間的結構了解得很清楚:它是由一組基生成的,不同的基直接有何關係。但是這顯得太過於簡單了,並沒有什麼可研究的。這部分內容我認為可以用兩句話概況:線性空間和線性映射的範疇是個 Abel 範疇,每個線性空間都有維數。
第二部分可以算是研究「帶有一個線性運算元的線性空間」的幾何,雖然我們的主要工具是 PID 上有限生成模,代數意味顯得比幾何意味更濃。其實硬要說我覺得前兩個部分並不怎麼「幾何」,感覺都是結構定理為主。
第三部分應該才算是幾何了,主要研究「帶有一個二次型或者雙線性型的線性空間」的幾何。在給出了適當的結構定理之後,我們可以確定出一系列 的子群(保持這個二次型不變的線性變換),它們的重要性是毋庸置疑的;然後以這個「帶有結構的線性空間」作為 model 將其「仿射化」就開啟了最簡單的線性的幾何的研究。這個「仿射化」是我自己不知道如何表達而造的詞(可能有這樣的詞了只是我不知道),意思就是以一個線性空間為 model 作一個仿射空間並且把這個線性空間上面的二次型或者雙線性型也搬到這個仿射空間上面去;例如,一個歐幾里得空間就是一個帶有正定內積的實線性空間的「仿射化」,自然一個仿射空間就是一個什麼都沒有的線性空間的「仿射化」了。
如果認為仿射幾何是最簡單的幾何,那這樣得到的無疑是第二簡單的幾何了。這些幾何自然是 Klein 意義下的幾何,涉及到的群總是會跟前面給出的 的子群有關。
說到二次型和幾何那 Clifford 代數總是繞不開的話題。
(哎我全都不懂我不寫了。。我就是那種「來自中國大陸」又只能「大談數學的哲學,而不能坐下來做紮實的計算」的學生)
從物理的角度來談,
諧振子系統就是二次型最典型的應用。
諧振子動能,勢能均為二次型。
對於多自由度情況,可以引入簡正坐標。
實際上,物理上與二階張量相關的問題,實際上都與二次型有關。
要說意義其實很簡單呀。
二次型就是多元的二次函數而已。
如果有多個自變數。那麼一次函數就是他們的線性組合y=a1x1+...anxn,用矩陣符號可以簡化這個表達y=Ax,而二次函數就是這些自變數自己的平方加上兩兩乘積,用矩陣符號簡化為xTAx。
二次型是多線性代數(張量代數)的玩具。
給出一個圖形的方程,即使它不是那種標準的圖形的方程,比如不是標準圓和標準橢圓的方程,有旋轉有偏移。利用二次型,也可以在坐標系下繪出它的圖形。
我說的標準,是指中心在原點,長軸短軸分別和坐標軸重合。
目標函數在極小點附近作泰勒展開:
如果忽略高階項就是一個正定二次型,其中 G 為在極小值點的Hesse矩陣((半)正定). 因而可知一般函數在極小點附近可以用正定二次函數很好地近似,因此能否有效的求得正定二次函數的極小點,是檢驗一個優化演算法(好多及其學習的演算法最後都要用到數值優化的演算法)好壞的標準之一。稱為二次終止性. 同時二次型也是個凸函數,凸優化在機器學習中也有很多應用。
自濾應濾波,代價函數是二次型
對稱雙線性型
二次型可以表示很多曲線和曲面,尤其可以用了研究高維狀態下的曲面。寫出二次型的式子看看,每個平方項前面係數是可以改變的。
推薦閱讀:
※最大似然估計和最小二乘法怎麼理解?
※把一張紙捏成一個球,球的大小和紙的大小有什麼關係?
※一條無限長的繩子是否打不成死結?
※光是如何知道哪條路線最快的,費馬原理是不是違背常理呢?
※拉普拉斯變換的物理意義是什麼?