為什麼核範數能凸近似矩陣的秩?為什麼核範數是凸的?
第一問:nuclear norm 是奇異值的和,rank是非零奇異值的個數。nuclear norm能近似rank就跟 norm能近似norm一樣。
第二問:1) 首先矩陣誘導範數是凸的:令,則凸,故凸。特別地,凸(即奇異值的最大值)。
2) 因為是的對偶範數(一個是和,一個是最大值,就和norm跟norm之間的關係一樣),所以凸。實際上,。故跟1) 同理,凸。簡單說一下,如果想搞清楚細節,參考Rockafellar的Convex Analysis
結論: 是在一定意義下,rank的最佳凸估計/凸鬆弛(convex relaxation)。
下面第一部分解釋是是什麼意義下的最佳,第二部分解釋為什麼nuclear norm是rank的convex relaxation。
========第一部分========
(將要涉及到的一些概念:extended-valued function, epigraph, lower semicontinuous, convex conjugate)
Let .
- The convex conjugate is lower semicontinuous.
- The biconjugate is the largest lower semicontinuous convex function satisfying for all .
而lower semicontinuous和 close等價。
所以,biconjugate就相當於對原函數的epigraph 做convex hull(滿足凸性),然後再做closure(閉集)所得到的函數。一般來說,一個函數的biconjugate稱為這個函數的convex relaxation。
========第二部分========
比如我們RPCA里,我們對sparse部分的penalty應該是 ,在 的條件下(重要), 的biconjugate就是 。
proof: denote ,
,
其實矩陣的nuclear norm是rank的convex relaxation可以看作是上面的推論。說一下idea,一個m*n的矩陣 ,有奇異值分解(SVD) 。 把 對角線元素(共 個)當作一個向量 。 , 。因為奇異值本身都大於等於0,所以nuclear norm等於奇異值直接求和。當然,這裡 是 的convex relaxation還需要一個前提條件,就是 所有的奇異值都小於等於1(在 的條件下 才是 的biconjugate)。
核範數只是在L無窮球上是rank的凸包
推薦閱讀:
※向量/矩陣導數是屬於哪個學科的內容?有什麼好的教材/資料可以推薦?
※行列式與矩陣是什麼關係?
※數學家最初發明行列式和矩陣是為了解決什麼問題?