如何理解這個哈密頓凱萊定理的證明?

這是張賢科先生的高等代數書上的證明。我看的時候疑惑是

1.為什麼就把線性映射當做矩陣元放到矩陣對角線上去了…?按照矩陣乘法的定義這樣一來不就是」線性映射乘以向量」了么…難不成是想看做形式上的乘法?可是如果這樣記這有什麼作用呢…?還是不懂…

2.接下來又把線性映射換成了λ這個符號…然後是不定元λ是矩陣元…

3.到最後得出f(λ)αi=0…這裡是個乘法…可是又看成了映射…隱隱約約覺著和剛開始把映射看成乘法有什麼關係…可是還是不明白…

希望各位能幫我解答一下疑惑,先謝謝了


感謝邀請。Caylay-Hamilton定理是我在線性代數裡面比較喜歡的幾個定理之一,因為她簡潔漂亮而且難得的非平凡,並且還能夠跟一些高觀點下的東西有互動,比如Nakayama引理。但是不少教材會使用一些更強的命題來證明,比如複數域上的Schur定理乃至Jordan分解。這不光掩蓋了這個定理的非平凡性,而且妨礙了進一步的推廣。

至於題主給的這個證明,包括@白如冰重新寫的,個人感覺是還是有問題的,且不論記號上面有些混亂吧(所謂的abuse of notation),就算是作者是從一個高觀點出發的,對於初學者來說我覺得最好還是還原到合適的語言。【重點在於,乘在那一行列向量上面的東西絕對不是A^T而應該是A^T tensor I】我嘗試也重新寫一個證明吧,證明的過程與原文完全一樣,但儘可能用矩陣的語言來寫。閱讀要求:行列式及其性質、伴隨矩陣、分塊矩陣及其乘法。東西寫的比較初等,高手莫噴。

首先,GTMD公式編輯器。當我打完egin{vmatrix}然後自然地按下回車之後得到了一個輸入的公式有誤我覺得我可能是用的假的latex. 對於長一點的公式,一行真的不夠用. 所以還是手寫吧. 字丑見諒……

註:

  1. 寫分塊矩陣的時候,右下角標是指有多少塊.
  2. 注意detmathcal{A}mathcal A_{ij} 也都是n階方陣,並且與每一塊的A_{ij} 可交換. 而mathcal A^* 是mn階的方陣.
  3. 交換條件不可省略,否則的話乘法都要考慮順序就全部亂套了. 【一般地,我們也只會在交換環上定義行列式】
  4. 在交換條件下,矩陣的乘法和數的乘法沒什麼差別,而且在行列式裡面只涉及到加減和乘法,不涉及除法,所以這樣定義的行列式也滿足通常行列式的幾乎所有性質. 可能不同書上記號不一樣,但是不要緊,翻譯一下就可以了,畢竟身體雖然變小頭腦依舊靈活無所不知的名偵探行列式的定義通常只有一個.

下面我們來看證明:

註:有些教材上會考慮行向量空間,或者喜歡把矩陣乘在右邊,如果是這樣的話,只要把e_i取成行向量,或者總之拼的時候橫著拼就對了。

最後,照應一下開頭,GTMD公式編輯器。


作者腦子裡想的是多項式環上的模,只是懶得徹底翻譯成更初等的語言。可參考任何一本有模論的抽象代數教程,F[x]上的模幾乎是必講的。只要理解了F[x]上的模=F上的向量空間+一個線性變換,題主的問題就迎刃而解了。

簡單回答一下題主問題。題主感覺是對的,就是把線性變換A作用在一個向量上看成數乘。那麼A對應哪個數呢?答案是哪個數都不是,A根本不是域裡面的元素,所以是未定元。


謝邀。

這個定理我當初看的時候也理解了半天,關鍵是理解這一步:

(lambda I-A^T)(alpha_1,...,alpha_n)^T=0

(lambda I-A^T)(alpha_1,...,alpha_n)^T 會產生n 個向量:

lambdaalpha_j-(a_{1j}alpha_1+...+a_{nj}alpha_n),1leq jleq n

上述等式的含義就是,當把不定元lambda 替換為線性變換mathcal{A} 時,對任意j 滿足1leq jleq n ,有

lambdaalpha_j-(a_{1j}alpha_1+...+a_{nj}alpha_n)=0

成立。即(lambda I-A^T)(alpha_1,...,alpha_n)^T 的運算結果,把lambda 替換為mathcal{A} 時,

產生的是n 個零向量,進而有

(lambda I-A^T)^{*}[(lambda I-A^T)(alpha_1,...,alpha_n)^T]=0

而根據線性運算的複合和矩陣乘法的關係,上述式子等價於先運算(lambda I-A^T)^{*}(lambda I - A) ,然後再作用在(alpha_1,...,alpha_n)^T 上,然後再把不定元lambda 替換為mathcal{A} 成立。

定理證明過程中最後一個式子寫成

diag(det(lambda I - A^T),...,det(lambda I - A^T))(alpha_1,...,alpha_n)^T=0

更清楚一些。

我重新寫了一遍可以參考下


這個證明成立的關鍵在於矩陣係數多項式 Q(lambda)=lambda I-A 的係數和矩陣A是可交換的,這使得對於任意一個矩陣係數多項式 P(lambda) ,如果我們形式地有 P(lambda)Q(lambda)=R(lambda), 那麼就有 P(A)Q(A)=R(A).


這裡有一個類似的證明,寫的更容易接受,出自丘維聲《高等代數》下冊。

題主提供的這個證明我沒看懂。

第一步可以看做是定義了 有單位的交換環 F[A]上的矩陣,並定義了其和線性空間V中元素的乘積,再寫為矩陣形式。但是在第二步中,直接將變換A換做lambda,我覺得應當是不對的。

因為F[A]可能有零因子(例如當A是冪零變換時),其中兩個元素相等不能得到分解為A^k,k=1,2,...,m 的線性組合後各係數相同,而F[lambda]是整環,元素相等係數相同。所以把A換做lambda後相當於加強了條件。

我認為是不對的,請指教。


我具體寫一下怎麼通過R[mathfrak{A}] 模的角度證明。

假設我們有方程組AX=0 ,其中A 的係數屬於某個(交換含幺)環R ,向量Xin V^n ,V是R模,那麼A:V^n 	o V^n 就是R-線性映射。

在題主給的證明中,由於V 是R模,因此V是R[mathfrak{A}] 模,得到V^n 也是R[mathfrak{A}]模。由於diag(mathfrak{A})和矩陣A^T都是V^n 	o V^nR[mathfrak{A}]-線性映射,那麼diag(mathfrak{A}) - A^T 也是V^n 	o V^nR[mathfrak{A}]-線性映射。這樣就解釋了方程組(diag(mathfrak{A}) - A^T)X=0 的意義。

通過觀察域上的矩陣的行列式的定義,可以發現交換環上的矩陣也可以定義它的行列式。因此det(diag(mathfrak{A}) - A)=0。

且若有環同態f:R 	o S ,R上n階矩陣A ,定義S上矩陣overline{f}(A):overline{f}(A)_{i,j}=f(A_{i,j}) ,則f(det(A)) = det(overline{f}(A)) 。題目要求證明特徵多項式f_A(lambda)mathfrak{A} 代入時等於零。因此,定義varphi:R[lambda] 	o R[mathfrak{A}] ,則f_A(mathfrak{A}) = varphi(det(lambda I-A)) ,等於det(overline{varphi}(lambda I - A)) ,即det(diag(mathfrak{A}) - A) ,證明完畢

======================================

由於此處設計的環都是交換的,因此可以不區分左右模,又對角陣的轉置還是對角陣,於是方程組也可以寫作[α_i](diag(?) - A) = 0


這裡只是形式上的矩陣運算,你把它展開按照分量理解就行了。


推薦閱讀:

計算機專業,數學類學科定理的證明要掌握到什麼程度?
大家推薦一個矩陣類?
矩陣的譜半徑怎麼求?
行列式與矩陣之間的深刻聯繫是什麼?
十天之內如何逆襲線性代數和高數?

TAG:數學 | 線性代數 | 高等代數 |