矩陣奇異值與矩陣範數之間有什麼聯繫?
01-03
經常看到PAPER上說矩陣的範數,即矩陣的最大奇異值,但一直沒搞清楚兩者之間是如何聯繫的。
首先可以定義歐式空間的向量的範數,同時基於每一種向量範數,可以相應地定義矩陣的範數為
向量的範數存在多種定義方式,最常見的是範數,也就是歐式空間的長度:那麼相應的矩陣的範數即為當時,函數的最大值。
注意是對稱非負定矩陣,特徵值滿足,相應的特徵向量構成的一組標準正交基,那麼設根據知道有於是可知,即的最大特徵值的平方根,即的最大奇異值。不請自來.
首先矩陣的二範數有兩種, 一種是關於奇異值有如下結論:
若矩陣的個奇異值為, 則(1);(2).證明如下:
根據矩陣的奇異值分解, , 其中正交, 為對角線上為奇異值的對角陣.(1)根據正交矩陣的性質()有
;(2)記, 則
不妨設是最大的, 則令即可取得等號, 所以.我來拋磚引玉。白如冰比較詳細地推倒了公式,我就不贅述了。
一個矩陣A可以看為一個系統,但是這個系統對不同的輸入有不同的增益
(增益定義為Ax的norm比x的norm,而這個增益的最大值被定義為矩陣A的norm,注意這裡的變數是x,即可以取不同的輸入,而這個norm我之前學的都是用L2-norm定義的,L1怎麼做我沒見過)白如冰的答案里直接把x normalized了,而最後答案的意思應該是看A系統對什麼樣的輸入的系統效果最明顯?增益是多少?
最終我們可以知道,當系統輸入x是A"A的maximum egienvalue所對應的egienvector時,系統效果最明顯,此時增益為maximum egienvalue。我只根據自己的理解說一點intuition,不對的地方希望指正,希望對題主有幫助。
(由於我還沒學泛函分析,所以語言角度會非常粗糙,希望大家給我留言指正,很感激。)矩陣代數有比較詳細的推導。
矩陣A的2範數為矩陣(A的共軛轉置A)最大特徵根的平方根。也就是A的最大奇值。感謝評論區同學指正。用極大極小原理很好理解!
另外矩陣的F範數,是把矩陣拉成向量的2範數,並不是矩陣的2範數!矩陣的2範數就是作為運算元的2範數!
推薦閱讀:
※如何直觀理解矩陣和線性代數?
※hessian矩陣的特徵向量有什麼含義?
※如何對SPD流形上的測地距離進行凸近似?
※矩陣的指數函數到底說的是個啥?
※矩陣和向量組和線性方程組之間的關係是什麼?