這道矩陣題目如果從頭證明可以證明嗎?如何證明?

首先聲明一下不是問作業題,因為此題目有Hint其實很簡單了。只是後來感覺這題目不要提示應該也可以證明,試著想了一下但沒有想出來,所以想發上來看看大家有什麼看法。


先上結論:如果a,b是mxn,nxm的矩陣,並且1-ab可逆(設逆為c),那麼1-ba也可逆,且逆為

(1-ba)^-1=1+bca

怎麼猜到逆的表達式?注意到在任何非交換環中都有(1-x)^(-1)=1+x+x^2+...(形式上的,不嚴格),所以c=1+ab+abab+... 於是

(1-ba)^-1 =1+ba+b(ab)a+b(abab)a+... =1+b(1+ab+abab+...)a=1+bca

猜出來以後就可以直接證明了

(1+bca)(1-ba)=1+bca-ba-b(cab)a=1-bca-ba-b(c-1)a=1 (補全細節留作習題)

(1-ba)(1+bca)=1-ba+bca-b(abc)a=1-ba+bca-b(c-1)a=1. 證畢

運用到這題中,令a=y^t, b=x即可。

這個結論實際上是formal的,由於它只依賴非交換環的分配律,結合律和幺元的性質. 不依賴有限維方陣單邊逆即可逆的性質。 特別地,即使在泛函分析中,我們同樣有1-ab可逆推出1-ba可逆的性質。(這個是在學Fredholm operators時要用到的一個漂亮的小引理。如果模掉compact operators組成的理想,我們還可以得到1-ab is Fredholm iff 1-ba is Fredholm. )

要推廣的話,在任何一個pre-additive category(i.e. 兩個object(比如向量空間)之間的映射集合被賦予阿貝爾群結構,而且複合是Z-bilinear的), 都有: for any f:A--&>B, g:B--&>A, 1_A-gf is isomorphism iff 1_B-fg is isomorphism.


謝邀. 第一問哪怕沒有提示,恐怕也只能這麼做,因為矩陣的逆也就這一種定義. 但如果是第二問的話方法很多,如果是我的話會換個方法做,因為更熟悉西方的這一套理論,即如下公式:

A_{m	imes m},B_{m	imes n},C_{m	imes n},D_{n	imes n}是四個矩陣,如果A,D都可逆,那麼有

det Acdotdet(D-C^TA^{-1}B)=det Dcdotdet(A-BD^{-1}C^T)

證明就是對矩陣egin{pmatrix}AB\C^TDend{pmatrix}分別施以初等行變換和列變換,算兩次行列式. 我想這個結論大多數代數書上應該都有.

特別的,或者說一個常用的情形,就是A,D都是單位陣,那麼就變成了

det(I_n-C^TB)=det(I_m-BC^T)

這個就是第二問裡面需要的等式.


不需要第一問的形式,第二問也是可以直接證的。

  1. 必要性。I+xy^t的一個特徵值為1+x^ty,對應的特徵向量是x。行列式不為零的矩陣沒有零特徵值 (任意方陣都可以分解為Jordan標準形)。所以,|I+xy^t|
eq0,Longrightarrow,1+x^ty
eq0
  2. 充分性。xy^t只有x^ty0兩種特徵值,則I+xy^t只有1+x^ty1兩種特徵值 (由特徵值的定義可得)。所以,1+x^ty
eq0,Longrightarrow,|I+xy^t|
eq0

至於求逆矩陣的表達式,考慮I=(I+A)(I-A+A^2-A^3+cdots),若A^2=lambda A, 且|lambda|<1,則級數收斂,可以求出I+A的逆為I-frac{1}{1+lambda}A。具體到本例中,A=xy^t,lambda=x^ty

不過,|lambda|<1的限制過於嚴格。因為只要A沒有-1的特徵值 (即lambda=x^ty
eq-1),I+A就一定有逆矩陣,而且可證明此逆矩陣的表達式是不變的。這裡明明看起來不收斂的矩陣級數,卻有收斂的表達式,貌似挺有意思的。


可以的, 首先mathrm{rank}(xy^t)=1, 而xy^t的唯一的非零特徵值就是y^tx(這是因為mathrm{tr}(xy^t)=mathrm{tr}(y^tx).

熟知單位陣與秩為1的矩陣之和的行列式為1+lambda, 其中lambda是這個秩為1的矩陣的唯一非零特徵值.

於是det(I+xy^t)=1+y^tx.


(不知道題主是不是想看這個)

注意到

(I+xy^t)xy^t=xy^t+xy^txy^t=x(1+y^tx)y^t=(1+y^tx)xy^t

於是有

egin{align}
0=(1+y^tx)xy^t-(I+xy^t)xy^t \
(1+y^tx)I=(1+y^tx)I+(1+y^tx)xy^t-(I+xy^t)xy^t \
(1+y^tx)I=(1+y^tx)(I+xy^t)-(I+xy^t)xy^t \
(1+y^tx)I=(1+y^tx)(I+xy^t)-xy^t(I+xy^t) \
(1+y^tx)I=((1+y^tx)I-xy^t)(I+xy^t)
end{align}

因而1+y^tx 
e 0時,有I=(I-(1+y^tx)^{-1}xy^t)(I+xy^t)

事實上,對於A_{m 	imes n},B_{n 	imes m},如果I_m-AB非異,有下述結論,

egin{align}
I_n-BA=I_n-B(I_m-AB)(I_m-AB)^{-1}A \
=I_n-(I_n-BA)B(I_m-AB)^{-1}A \
I_n=I_n-BA+(I_n-BA)B(I_m-AB)^{-1}A \
I_n=(I_n-BA)(I_n+B(I_m-AB)^{-1}A)
end{align}


第一題:考察low-rank update,在數值優化中常用(對目標函數的Hesse矩陣或其逆進行修正,從而獲得更好的數值性質,例如數值穩定性或正定性等等。例子有SR1修正和BFGS修正)。有相應的定理,具體可查看wiki頁面,內容很詳細,也有幾種不同的證明方法(個人最喜歡的是分塊矩陣高斯消元。其實也就是@王箏給的第二問的解法,他用的是矩陣的Schur補,這個也是通過分塊矩陣高斯消元證明的)。

第二題:可以算行列式。在孫文瑜袁亞湘的數值優化里,有一個很暴力的解法:矩陣的行列式等於特徵值之積,強行算出題目所給的矩陣的特徵值(因為是秩一矩陣,所以很好求),然後乘起來得到行列式。題主可以先自己嘗試一下,不會算的話去翻袁亞湘第一章,網上有電子版(其實@王某魚已經給出關鍵步驟了)。


給一個更為直觀的回答。xy^t是一個rank為1的矩陣,所以xy^t作為線性變換其實是向一個一維子空間的投影,記為向量e0。yx^t是該矩陣的trace。將e0擴充為空間的一組基,則xy^t的trace其實就是e0的特徵值,結論就顯而易見了。


推薦閱讀:

為什麼部分人容易忘記數學證明,如何解決?
如何評價「世界上只有兩門真正的學問,一門是數學,一門是哲學」的觀點?
討論計算機專業人員的數學路線?
如何通俗易懂地解釋歐拉公式(e^πi+1=0)?
五人報數,從1至100中選一個整數來報,不可以重複報數,報數最大和最小的人輸掉。幾號獲勝的概率最大?

TAG:數學 | 高等代數 | 金融工程學 |