【代數初步02】考試不考的線性代數

【代數初步02】考試不考的線性代數

來自專欄數學系漫遊指南16 人贊了文章

上一篇:【代數初步01】群和等距同構

關於群論暫告一段落。我們現複習本科一年級的線性代數(或高等代數),熟悉的概念首先是有限維的實線性空間 mathbb R^N ,以及空間之間的線性映射 T:mathbb R^M
ightarrow mathbb R^N 。由於 mathbb R^N 可以由一組基張成,那麼線性映射就可以用矩陣來表示,從而可以用矩陣的各種性質來描述線性映射的性質,再者可以對線性變換(矩陣)做變換 X
ightarrow T_1XT_2 來儘可能地做「對角化」,常見的變換有奇異值分解(對稱矩陣則是譜分解)、Gram-Schimidt正規化、Jordan標準型等。線性代數中還會涉及一些矩陣論的基礎及應用,如解線性方程組等。

以上討論的線性空間一般都是歐氏空間,我們希望通過定義其上的「內積」來推廣成一般的帶「內積」的線性空間,再者聯繫幾何中張量積(tensor product)與外代數(exterior algebra)的概念,研究線性空間上的張量積和外代數。本文的內容與【CFT01】度規初步 有重合,但相對更注重數學上的嚴格推導。本文主要參考了M. Artin的代數教材[1]和藍以中的高代教材[2],如無特別說明,文中涉及到的線性空間均為有限維


對於線性空間,我們希望定義其上兩點之間的距離 d(x,y) ,或者是等價地其上的一個範數 |x| 。為此我們需要定義兩點之間的「關係」 langle x,y
angle ,使得模滿足 |x|^2=langle x,x
angle ,這就是雙線性型(bilinear form):

【雙線性型】 V 是域 mathbb K (注一)上的線性空間,定義雙線性函數 langlecdot ,cdot
angle: V	imes V
ightarrowmathbb K 滿足

langle kv_1+v_2,w
angle=klangle v_1,w
angle+langle v_2,w
anglelangle v,kw_1+w_2
angle=klangle v,w_1
angle+langle v,w_2
angle

V 是有限維的,{e_i}V 上的一組基,設 x=sum x_ie_i, y=sum y_je_jlangle x,y
angle=sum_{i,j}x_ilangle e_i,e_j
angle y_j ,即雙線性型由基處的函數值唯一確定,我們可以令 a_{ij}=langle e_i,e_j
anglelangle x,y
angle=sum_{i,j}x_ia_{ij}y_j ,寫成矩陣的形式即 x^	op Ay 。反之,對於兩個矩陣 A
e B ,若它們在不同的基下表示同一雙線性型,則由於 x^	op Ay=(Tar{x})^	op A(Tar{y})=ar{x}^	op (T^	op AT)ar{y}=ar{x}^	op Bar{y} ,得知它們是合同的(congruent)即

【合同矩陣】存在 T 使得 A, B 滿足 A=T^	op BT 則稱 A, B 是合同的。

易知合同關係是一個等價關係,那麼所有 V 上的雙線性型組成的集合可以看作是由 mathrm{Mat}_n(mathbb K) 模掉合同關係形成的商集。自然地我們希望選取一個等價類裡面的矩陣來「代表」其合同等價類,即找一組基使得雙線性型在該基下的矩陣具有最簡形式。

在此之前為了便於分析,我們先把雙線性型推廣到有限維複線性空間後限制為赫米特型(Hermitian form,或在實向量空間上是二次型quadratic form)。雙線性型推廣為 langle x,y
angle=x^dagger A y ,實際上對於復向量空間 mathbb C^n 考慮其對應了 mathbb R^{2n} ,則為了讓一個向量 x 的模為實數 langle x,x
angle =sumar{x}_ix_i=	ext{Re}(x_i)^2+	ext{Im}(x_i)^2 ,需要對其中一個輸入做共軛。相應地線性寫成 langle kv_1+v_2,w
angle=ar{k}langle v_1,w
angle+langle v_2,w
anglelangle v,kw_1+w_2
angle=klangle v,w_1
angle+langle v,w_2
angle 。對於赫米特型我們要求雙線性型具有對稱性(Hermitian symmetry)即 langle v,w
angle=overline{langle w,v
angle} ,即對應的矩陣為赫米特矩陣,滿足 A^dagger=A ,在實向量空間上這限制為實對稱矩陣。由於赫米特矩陣可以被對角化,我們可以選擇一組基使得該赫米特型能寫成其標準形式langle x,y
angle=sum_{i}x_id_{ii}y_i ,其中矩陣 D 由譜分解得出 A=Q^dagger DQQ 是酉矩陣(即 Q^dagger =Q^{-1} )。這裡我們有赫米特型的符號(signature)的定義:

【符號】對於實向量空間,二次型對應的矩陣分別具有 (p,q,r) 個正的、負的、和為零的對角元素,則稱 (p,q,r) 為其符號。若考慮非退化的(non-degenerate)二次型(即 r=0 ),則符號為 (p,q) 。注意到 N=p+q+r ,這裡 N 是維數。

根據Sylvesters law,符號不取決於基的選擇——此結論是顯然的,因為譜分解唯一。進一步通過做變換 x_i
ightarrow sqrt{|lambda_i|}x_i 我們可以將(實)二次型型寫成 u_1^2+cdots+u_p^2-v_1^2-cdots-v_q^2 的形式,對應的矩陣為 mathrm{diag}(1,cdots ,1,-1,cdots,-1,0cdots,0) ,而對於赫米特型 lambda_i 可以被開平方,即 u_1+cdots+u_{p+q}^2 對應矩陣 mathrm{diag}(1,cdots,1,0,cdots,0) ,這些被稱為二次型(或赫米特型)的規範形(canonical form),其由符號唯一決定。另外這裡還有一些小定義比如正定性(positive definite),指矩陣的特徵值全部為正(即 p=	ext{rank} (A)=N ),類似地還有負定性、半正定、半負定、非退化性(即 r=0 )等等。

有了雙線性型我們就可以將其附屬在線性空間上,來定義其上的模 |x|^2={langle x,x
angle} 。下面是幾個常見的空間:

  • 對實線性空間和正定的二次型(對應的矩陣對稱、特徵值皆正),我們有熟悉的歐氏空間(Euclidean space),其上的內積即該雙線性型,保持內積不變的線性映射(即 langle Ax,Ay
angle=langle x,y
angle )叫正交線性映射,可以由正交矩陣表示,它們組成了正交群(orthogonal group) mathrm O_N={Xinmathrm{Mat}_N(mathbb R):X^	op X=1} ,運算為矩陣的乘法(映射的複合)。
  • 自然地我們希望將上述討論推廣到複線性空間上,這裡需要非退化的赫米特型來定義內積。同樣地酉空間(unitary space) mathbb C^N 上保持內積的線性變換,稱酉變換(unitary transformation),可以由酉矩陣表示,它們組成了酉群(unitary group) mathrm U_N={Xinmathrm{Mat}_N(mathbb C): U^dagger U=1}
  • 我們繼續考慮實線性空間,另一種推廣是考慮非正定、非退化的雙線性型。對線性型 langlecdot ,cdot
angle 有符號 (p,q) ,我們說線性空間 mathbb R^N偽歐幾里得空間(pseudo-Euclidean space),並表示為 mathbb R^{p,q} 。那麼其上的保持雙線性型的線性變換稱洛倫茲變換(Lorentz transformation),它們組成了洛倫茲群(Lorentz group),記作 mathrm{O}_{p,q} 。另外 mathbb R^{p,q} 上的等距同構組成龐加萊群(Poincare group),洛倫茲群是它的一個子群。考慮二維的洛倫茲群 mathrm{O}_{1,1} ,雙線性型對應的矩陣為 G=mathrm{diag}(1,-1) ,洛倫茲變換滿足 A^	op GA=G ,參數化後即可表示成 egin{bmatrix}cosh x&sinh x\sinh x&cosh xend{bmatrix} ,一般稱此矩陣為度量矩陣(metric tensor)。另外,正交矩陣中列向量具有正交性,類似地對洛倫茲矩陣的列向量 q_iq_jlangle q_i,q_j
angle=delta_{ij}(chi_{i=jle p}-chi_{i=j>p}) ,其中 chi 是示性函數。
  • 我們還可以定義反對稱(anti-symmetric)的雙線性函數 langle x,y
angle=-langle x,y
angle ,其對應的矩陣也是反對稱的。注意到當 det A=det A^{	op}=det (-A)=(-1)^ndet A ,故奇數維的反對稱雙線性函數總是退化的。考慮 2M 維的複線性空間 mathbb C^{2M} 和一個非退化的反對稱雙線性函數,這樣的空間叫辛空間(symplectic space)。可以用歸納法證明辛空間存在一組基使得度量矩陣能表示成 mathrm{diag}(A,cdots, A) 的形式,其中 A=egin{bmatrix}0&1\-1&0end{bmatrix} ,這組基被稱為第一類辛基;重排這組基可以使辛矩陣變成 egin{bmatrix}0&1_{M}\-1_M&0end{bmatrix} 的形式,這時基稱為第二類辛基。類似地,保持內積的線性變換叫辛變換,對應了辛矩陣滿足 M^dagger G M=G ,組成辛群 mathrm{SP}_{2M} 。注意到辛矩陣的行列式必然為1,故此字母S的使用不會引起歧義。

證明辛矩陣的行列式為1:易求得 G 行列式為1(交換行即可),我們對 M^dagger GM=G 兩邊求行列式,則 M 的行列式為 pm 1 。再對上式兩邊取Pfaffian,由Pfaffian性質可知 mathrm{Pf}(G)=mathrm{Pf} (M^dagger GM)=det(M)mathrm{Pf}(G) mathrm{Pf}(G)=sqrt{det G}
e 0 得知 det M 一定為 +1

以上是關於有內積的線性空間的定義。狹義的內積是指非退化、正定的雙線性函數,即對應歐氏空間 mathbb R^N 和酉空間 mathbb C^N ,它們同構於所有有限維的希爾伯特空間,對應的度量矩陣總可以被化簡為單位陣。在黎曼流形上對於一個小鄰域,其切空間同胚於洛倫茲空間 mathbb R^{p,q} ,此時內積是切空間上定義的度規張量。


關於線性空間,一個在分析、幾何、代數上都占重要地位的概念是對偶空間(dual space):

【對偶空間】 V 是域 mathbb K 上的線性空間,考慮線性函數 f:V
ightarrowmathbb K ,即滿足 f(kx+y)=kf(x)+f(y) ,全體這樣的線性函數構成一個線性空間稱 V 的對偶空間,記作 V^* 。這裡加法定義為 (f+g)(x)=f(x)+g(x) ,數乘定義為 (kf)(x)=kf(x)

考慮有限維的線性空間 V 有一組基 {e_i} ,易知線性函數由其在基上的取值唯一決定,即 f(x)=f(sum x_ie_i)=sum x_if(e_i) ,我們定義 V^* 上的一族元素 {f_i} 滿足 f_i(e_j)=delta_{ij} ,我們發現首先它們是線性無關的:假設它們線性相關即 forall a, exists k_i	ext{ s.t. }sum k_if_i(a)=0 ,那麼令 a=e_j ,則 k_jf_j(e_j)=k_j=0 矛盾得證,故 dim V^*ge n ;再證明任一線性函數都能用其線性表示:對於任一線性函數 g(x)=g(sum x_ie_i)=sum x_ig(e_i)=sum f_i(x)g(e_i) ,故 g=sum g(e_i)f_i 得證。由此 dim V=dim V^* ,故有限維線性空間與其對偶空間同構,此同構依賴基 {e_i} 的選擇。

再者,如果我們對對偶空間再做對偶得到 V^{**} ,我們定義一族 V^{**} 上的元素 {Phi_i} 滿足 Phi_i(f_j)=delta_{ij} (線性泛函由基上取值唯一決定),則類似地 {Phi_i} 是一組 V^{**} 上的基。我們稱 sigma({e_i})=Phi_iVV^{**} 上的典範同構(canonical homomorphism),這個同構不依賴一開始的基 {e^i} 的選擇。

上述命題的證明:對線性空間 V 及其對偶 V^{*} 和雙重對偶 V^{**} ,按上述aXX有基 {e_i},{f_i},{Phi_i} ;另有基 {e_i},{f_i},{Phi_i} ,這兩類基可以互相表示 e_i=sum a_{im}e_m, f_i=sum b_{im}f_m, Phi_i=sum c_{im}Phi_m 。現在對於它們的「正交性」,有 delta_{ij}=f_i(e_j)=sum_{m,n}a_{jm}b_{in}f_n(e_m)=sum_{m}a_{jm}b_{im} ,同理對於 f_iPhi_jsum_{m}c_{jm}b_{im}=delta_{ij} 。觀察到由 a_{ij},b_{ij},c_{ij} 組成的三個矩陣 A,B,C 滿足 AB=CB=1 ,故有 A=C 。那麼對於任意 V 上的元素 x=sum x_ie_i=sum_{i,m} x_ia_{im}e_m ,則 sigma(x)=sum x_iPhi_i=sum_{i,m}x_ia_{im}Phi_m=sigma(x)

進一步,我們發現 V^* 上的元素和雙線性型存在對應關係。若 {e_i}, {f_i}V, V^* 上的基, V 上有雙線性型對應矩陣 (g_{ij}) ,其逆矩陣記為 (g_{ik}^{-1}) ,則由於 sum_{k}g^{-1}_{ik}langle e_k,e_j
angle=sum_k g^{-1}_{ik}g_{kj}=delta_{ij}=f_{i}(e_j) ,我們便說 f_i=sum_k g^{-1}_{ik}langle e_k,cdot
angle 。現在考慮和 x=sum x_ie_iin V 對應的線性泛函 langle x, cdot 
anglein V^* ,有 langle x,cdot
angle=sum x_ilangle e_i,cdot
angle=sum x_ig_{ik}g_{ik}^{-1}langle e_i,cdot
angle=sum_kleft(sum_i g_{ik}x_i 
ight)f_k ,也就是說它的係數是 sum g_{ik}x_i 。在愛因斯坦求和約定中,我們記 x_ix^{i} ,記 g_{ij}^{-1}g^{ij} ,記 langle x,cdot
angle{f_i} 下的係數為 x_i ,並省略求和記號,則上式寫成 x_i=g^{ij}x_j 。現在不妨將 f_i 記為 mathbf e^i ,則在對偶空間上自然地定義了一個雙線性函數: langle mathbf e^i,mathbf e^j
angle=g^{ialpha}g^{jeta}langle mathbf e_alpha,mathbf e_eta
angle= g^{ialpha}g^{jeta}g_{alphaeta}=g^{jeta}delta_{,eta}^i=g^{ji} ,故此重複上述討論我們可以寫出坐標的逆變換 x^i=g^{ij}x_j ,其中 x^iV^{**} 中元素的坐標(典範同構於 V 中有相同坐標的元素)。一般我們稱呼 V 中的元素為向量(vector)、坐標為反變(contravariant)坐標,標號在上;而稱呼 V^* 中的元素為余向量(covector)、坐標為共變(covariant)坐標,標號在下。

【愛因斯坦求和約定】

V 中有向量 x^imathbf e_i ,雙線性型 langle mathbf e_i,mathbf e_j
angle=g_{ij}

V^* 中有餘向量 y_imathbf e^i ,雙線性型 langle mathbf e^i,mathbf e^j
angle=g^{ji}

向量和余向量之間有坐標變換 x^imathbf e_i=langle x_imathbf e^i,cdot
angle 或等價地 langle x^imathbf e_i,cdot
angle=x_imathbf e^i ,滿足 x_i=g_{ij}x^j 或等價地 x^i=g^{ij}x_j

兩組基之間有關係 langlemathbf e^i,mathbf e_j
angle=mathbf e^i(mathbf e_j)=delta^i_{,j} ,故若 g_{ij}=delta_{ij} (黎曼度量),則 V 上的基和其對偶基可被視為相同;

度量矩陣和其逆滿足關係 g_{ij}g^{jk}=delta_i^{,k}

注意到愛因斯坦求和約定中,省略掉求和符號的前提是我們涉及的所有函數都是線性的,即 sum f=fleft(sum
ight) ,否則不能交換求和與函數的順序。


多重線性代數(Multilinear algrbra)中,我們考慮雙線性型的推廣——多重線性映射(multilinear map):

【多重線性映射】 T:V^*	imescdots	imes V^*	imes V	imescdots	imes V
ightarrow mathbb W 滿足在每個元素上都有線性。這裡 	imes 是笛卡爾直積,一共有 mV^*nV 。當 Wmathbb K 時稱為多重線性函數(multilinear function,或者稱多重線性泛函,multilinear functional)。

這裡讓 V^* 中的元素也是自變數是因為我們希望將對偶空間和原空間聯繫起來,而不加入更多重的對偶是因為我們將 V^{**} 視為原空間(由典範同構)。考慮有限維的 V 上有一組基 mathbf{e}={mathbf e_i} ,誘導出 V^{*} 上的對偶基 {mathbf e^i} ,我們記 T 在基下的取值為 T^{i_1,cdots i_m}_{j_1,cdots,j_n}[mathbf e]=T(mathbf e^{i_1},cdots,mathbf e^{i_m},mathbf e_{j_1},cdots,mathbf e_{j_n}) ,這唯一決定了該多重線性函數,此時 T 又稱 (m,n) 形的張量(tensor)。現在注意到余向量是 (1,0) 型的張量(由於是線性泛函);而向量看成 V^{**} 上的元素則是 (1,0) 型的張量( V^{**} 上的線性泛函);雙線性型是 (0,2) 型的張量,可以表示為矩陣 G=(g_{ij}) 其中 g_{ij}=g_{ij}[mathbf e]=langle mathbf e_i,mathbf e_j
angle ,故張量是向量、矩陣的高維推廣。

我們希望將張量放在一個空間裡面考慮,該空間稱張量積空間(tensor product space),故第一步是先構造該空間,考慮簡單的由兩個線性空間構成的張量積(tensor product):

【張量積】 UV 是域 mathbb K 上的線性空間, W 也是域 mathbb K 上的線性空間,若存在雙線性映射 otimes:U	imes V
ightarrow W ,使得對於任意雙線性映射 f:U	imes V
ightarrow P ,其中 P 是任取得域 mathbb K 上的線性空間,都存在唯一線性映射 	au:W
ightarrow P ,滿足 f=	aucircotimes ,則稱 W (與 otimes )是 U,V 的一個張量積。

由定義可知張量積空間保持線性泛函不變,下面我們來證明張量積空間在同構意義下的唯一性。假設 (W,otimes),(W,otimes) 是兩個 U,V 的張量積,則由定義存在唯一的線性映射 	au: W
ightarrow W 滿足 otimes=	aucircotimes 和唯一的 	au:W
ightarrow W 滿足 otimes=	aucircotimes ,即 otimes = 	aucirc	aucircotimes ,由定義存在唯一線性映射 mathrm{id}_W:W
ightarrow W 滿足 otimes=mathrm{id}_Wcircotimes ,故 	aucirc	au=mathrm{id}_W ,同理 	aucirc	au=mathrm{id}_{W} ,故 	au 是可逆的線性映射,則 W,W 同構。我們用 Uotimes V 來表示其唯一張量積,用 mathbf uotimesmathbf v 來表示兩個向量在 otimes 下的像,由雙線性:

(a_1mathbf u_1+mathbf u_2)otimes mathbf v=a_1mathbf u_1otimes mathbf v+mathbf u_2otimes mathbf v

mathbf uotimes(b_1mathbf v_1+mathbf v_2)=b_1mathbf uotimes mathbf v_1+mathbf uotimes mathbf v_2

a(mathbf u otimes mathbf v)=(amathbf u)otimes mathbf v=mathbf uotimes (amathbf v)

對於有限維的線性空間,我們通過基來構造其張量積。在 U 中取一組基 {mathbf u_i}V 中取一組基 {mathbf v_i} ,通過雙線性映射 otimes 構造一組基 {mathbf u_iotimesmathbf v_j} ,則我們說該基張成的空間就是 Uotimes V 。證明如下:對於任意雙線性映射 f:U	imes V
ightarrow P 其由 f(mathbf u_i,mathbf v_j) 的取值唯一決定,我們構造線性映射 	au: W
ightarrow P 其中 	au(mathbf u_iotimesmathbf v_j)=f(mathbf u_i,mathbf v_j) ,則易知 	aucircotimes=f ;對於唯一性假設我們知道基上取值唯一決定了線性映射,得證。另外我們有推論 dim Uotimes V=dim Udim V

現在我們可以把張量放在張量空間中,考慮空間 (V)^{otimes m}otimes(V^*)^{otimes n} (注意張量空間不同),其上的元素 T 在基 left{igotimes_{sigma=1}^mmathbf e_{i_sigma}otimesigotimes_{
ho=1}^nmathbf e^{j_
ho}
ight} 下的坐標為 T^{i_1,cdots,i_m}_{j_1,cdots,j_n} ;另一方面對於上述的多重線性泛函 T:prod^m_{sigma=1}V^*_{i_sigma}	imesprod^n_{
ho=1}V_{j_
ho}
ightarrow mathbb K ,其在基上的取值也為 T^{i_1,cdots,i_m}_{j_1,cdots,j_n} ,我們不區分兩者,且均記 T=T_{j_1,cdots,j_q}^{i_1,cdots,i_p}mathbf e_{i_1}otimescdotsotimesmathbf e_{i_p}otimesmathbf e^{j_1}otimescdotsotimesmathbf e^{j_q} ,這裡用到愛因斯坦求和約定。張量的加法和數乘即一般向量的加法數乘(前提是在同一張量空間),我們還可以定義不同張量空間中的乘法:

【張量乘法】若 a,b 是張量,則定義其乘積為張量積ab:=aotimes b=c, c^{i_1,cdots,i_p,k_1,cdots,k_r}_{j_1,cdots,j_q,l_1,cdots,l_s}=a^{i_1,cdots,i_p}_{j_1,cdots,j_q}b^{k_1,cdots,k_r}_{l_1,cdots,l_s}

張量還可以做縮並運算(contraction):

【縮並】是一個線性泛函 C:V^*otimes V
ightarrowmathbb K 滿足 C(f,v)=f(v) ,或等價地在基上的定義為 C_{i,j}(mathbf e^i,mathbf e_j)=mathbf e^i(mathbf e_j)=delta^{i}_{,j}

故此對於張量 T^i_{j} 縮並 i,j 得到 T_i^i:=sum_{i=1}^NT_{i}^i=mathrm{Tr}(T) ,其是矩陣求跡的推廣。在書寫上我們將乘法和縮並寫在一起,若標號不一致則是普通的張量乘法,若標號一致則先做張量乘法再對一致的標號做縮並,即 A_{ij}B^i:=C_{i,i}(A_{ij}otimes B^{i})=A_{ij}delta_{i}^{i}B^{i}


在線性空間上並沒有向量之間的「乘法」運算,補全其乘法使其成為一個新的代數系統叫代數(algebra):

【代數】域 mathbb K 上的代數 A 是一個線性空間和運算 cdot:A	imes A
ightarrow A 滿足左右分配律和數乘:

mathbf xcdot(mathbf y+mathbf z)=mathbf xcdotmathbf y+mathbf xcdotmathbf z

(mathbf x+mathbf y)cdotmathbf z=mathbf xcdotmathbf y+mathbf xcdotmathbf z

(amathbf x)cdot (bmathbf y)=(ab)mathbf xcdotmathbf y

我們說該代數是交換的如果 mathbf xcdotmathbf y=mathbf ycdotmathbf x 、結合的如果 mathbf xcdot(mathbf ycdotmathbf z)=(mathbf xcdotmathbf y)cdotmathbf z

例如,四元數是一個域 mathbb C 上的非交換、結合代數, mathrm{Mat}_N(mathbb K) 是域 mathbb K 上的非交換、結合代數,線性空間和向量叉乘組成非交換、非結合代數。

對於線性空間 V 上的任意向量 u,v ,我們往 V 中「加入」新的元素 u	imes v ,使其還是線性空間,其中「乘法」滿足一些給定的性質,這樣加入元素的操作做完以後得到的線性空間自然是一個代數(而且是最大的)。實際上我們把這個操作具體化成以下步驟:首先構造線性空間 {u_1	imes u_2}, {u_1	imes u_2	imes u_3},cdots ,這裡所有 u_iin V ,然後將對所有的這樣的線性空間做直和,仍然得到一個線性空間,且裡面有乘法運算,將兩個「低重數」的向量映射為一個高重數的向量。在這裡我們考慮的乘法要求滿足交錯性(或者稱反對稱性),即 mathbf xcdotmathbf y=-mathbf ycdotmathbf x ,和結合性,則得到的代數被稱為外代數(exterior algebra)。

首先我們需要定義具有某重數的線性空間,為此先定義線性映射的交錯性(alternativity):

【交錯性】我們說一個多重線性函數是交錯的,如果交換任意一對輸入,得到的值為相反數,即 f(cdots,x_i,cdots,x_j,cdots)=-f(cdots,x_j,cdots,x_i,cdots) ,我們還說這個多重線性函數是 p 重的如果其有 p 個自變數。

注意到若 x_1,cdots,x_Ninmathbb R^N ,則行列式是一個 N 階交錯多重線性函數。 p 重交錯多重線性函數有以下性質(這裡舉例 p=2 ):

  • 在各個自變數上線性,即f(ku_1+u_2, v)=kf(u_1,v)+f(u_2,v)
  • 滿足交錯性,即 f(u,v)=-f(v,u)
  • f(u,u)=0 。進一步如果自變數是線性相關的,則函數值為0。

對於所有 p 重交錯多重線性函數,其構成一個線性空間,且每個線性函數由其在基上的取值 f(mathbf e_{i_1},cdots,mathbf e_{i_p}) 唯一決定。再者由交錯性得知我們可以給定順序 i_1<cdots<i_p 使得對於任意 i_sigma 的重排 pi ,有 f(mathbf e_{pi(i_1)},cdots,mathbf e_{pi(i_p)})=mathrm{sgn}(pi)f(mathbf e_{i_1},cdots,mathbf e_{i_p}) 成立,故此我們可以考慮等價類 {mathbf e_{pi(i_1)}otimescdotsotimesmathbf e_{pi(i_p)}:forall pi} 為這個線性空間的基。那麼一種直接的思路是定義這個由 p 重交錯多重線性函數構成的線性空間為張量空間 igotimes_{i=1}^N V_i 的一個商空間,即模掉等價類 mathrm{Span}{mathbf e_{pi(i_1)}otimescdotsotimesmathbf e_{pi(i_p)}:forall pi} 。但在這裡我們採用另一種定義方式,即採用其對偶空間:

p 重外代數】考慮所有 V 上的 p 重交錯線性函數組成的線性空間,我們定義 V 的一個 p 重外代數 Lambda^p V 為其對偶空間。

注意我們的目標是把 Lambda^pV 上的任意元素對應到 Vp 個向量的乘法。現在我們定義一個 p 個向量之間的乘法運算,用來構造 p 重外代數:

p 重楔積】定義 p 重楔積(wedge product) wedge 為一個 prod_{i=1}^p V_i
ightarrow Lambda^p V 的線性映射,滿足 (u_1wedgecdotswedge u_p)(f)=f(u_1,cdots,u_p) ,其中 f 是任意 p 重交錯線性函數。

通過 p 重交錯線性函數的性質,容易驗證 p 重楔積的性質(這裡舉例 p=2 ):

  • 在各個自變數上線性,即(u_1+u_2)wedge v=u_1wedge v+u_2wedge v(ku)wedge v=k(uwedge v)
  • 滿足交錯性,即 uwedge v=-vwedge u
  • 如果有兩個自變數是一樣的則 p 重楔積為0,即 uwedge u=0 。進一步如果自變數是線性相關的,則楔積為0。

楔積能用來構造外代數的基,我們有下列命題:

{mathbf e_i}V 的一組基,則 {mathbf e_{i_1}wedgecdotswedgemathbf e_{i_p}:i_1<cdots<i_p} 組成 Lambda^pV 的一組基。

證明如下:

考慮 p 重交錯線性函數 f_{i_1,cdots,i_p} 其中 i_1<cdots<i_p ,其在基上定義如下: f_{i_1,cdots,i_p}(mathbf e_{i_1},cdots,mathbf e_{i_p})=1 且對於任意 (j_1,cdots,j_p)
e(i_1,cdots,i_p)f_{i_1,cdots,i_p}(mathbf e_{j_1},cdots,mathbf e_{j_p})=0 ,那麼對於任意 p 重交錯線性函數 f ,都可以表示成 {f_{i_1,cdots,i_p}:forall i_1<cdots<i_p} 的一個線性組合,故 {f_{i_1,cdots,i_p}:forall i_1<cdots<i_p} 是該線性空間的一組基。易知 (mathbf e_{i_1}wedgecdotswedgemathbf e_{i_p})(f_{j_1,cdots,j_p})=delta_{(i_1,cdots,i_p)=(j_1,cdots,j_p)} ,則 mathbf e_{i_1}wedgecdotswedgemathbf e_{i_p} 是其一組對偶基,而維數則等於在 N 個基中取 p 個即 dimLambda^pV={Nchoose p}

現在我們有了 p 重外代數,對其做直和得到外代數(或叫Grassman代數):

【外代數】所有 p 重外代數的直和稱為外代數,記作 Lambda V=igoplus_{p=0}^NLambda^pV

這個直和只做到 p=N 因為對於 p>Np 重交錯線性函數總是平凡的。我們定義向量的楔積:

【向量的楔積】定義楔積 wedge 為一個 prod_{p=0}^Nleft(prod_{i=1}^p V_i
ight)
ightarrow Lambda V 的線性映射,滿足 (u_1wedgecdotswedge u_p)(f)=wedge_p(u_1,cdots,u_p) ,其中 wedge_pp 重楔積。

對於 p 重外代數上的元素,我們希望其楔積也能和向量的楔積相容:

【楔積】定義楔積 wedge 為一個二元運算 Lambda^pV	imesLambda^qV
ightarrowLambda^{p+q}V ,滿足 awedge b=(u_1wedgecdotswedge u_p)wedge(v_1wedgecdotswedge v_q)=u_1wedgecdotswedge u_pwedge v_1wedgecdotswedge v_q

我們需要說明這個定義是良好的,即對任意 a=u_1wedge u_2=u_1wedge u_2 都有 awedge v 相等,而事實上我們將楔積在基處展開可知 u_1wedge u_2=u_1^iu_2^imathbf e_iwedge mathbf e_j=u_1wedge u_2=u_1^iu_2^imathbf e_iwedge mathbf e_j ,它們相等的充要條件是 u_1^iu_2^j=u_1^iu_2^j=:a^{ij} ,則對於兩種表示都有 awedge v=a^{ij}v^kmathbf e_iwedgemathbf e_jwedgemathbf e_k 。故此易證得楔積具有結合性,我們容易寫出楔積的性質:

  • 線性,即 (ka_1+a_2)wedge b=ka_1wedge b+a_2wedge b
  • 交錯性,即 awedge b=(-1)^{p+q}bwedge a, ainLambda^pV, binLambda^qV
  • 結合性,即 awedge bwedge c 是良好定義的;
  • awedge a=0

最後我們考慮坐標變換對外代數的影響。考慮線性變換 T:V
ightarrow WW 上的 p 重外代數 Lambda^pW ,由於 W 上的 p 重線性函數 f:prod^p_{i=1}W_i
ightarrow mathbb K 可以誘導出 V 上的 p 重線性函數 f:prod^p_{i=1}V_i
ightarrow mathbb K, f(v_1,cdots,v_p)=fcirc T(v_1,cdots,v_p) ,故這定義了其對偶空間上的對偶映射 Lambda^pT:Lambda^pV
ightarrowLambda^pW, Lambda^pT(v_1wedgecdotswedge v_p)=T(v_1)wedgecdotswedge T(v_p) 。當 p=N 時, dimLambda^NV=1=dimLambda^NT ,故 Lambda^NT 應該給出一個標量。考慮到 Lambda^NT 是線性的我們有 T(v_1)wedgecdotswedge T(v_N)=sum_{i_1,...,i_N}T_{i_11}cdots T_{i_NN}v_{i_1}∧cdots∧v_{i_n} ,對 i_sigma 做置換 pi 我們有 Lambda^NT(v_1wedgecdots v_N)=sum_{pi}T_{pi(1)1}cdots T_{pi(N)N}v_1wedgecdots v_N ,而該係數正是行列式 det T 的(算術)定義,故此從這個角度我們認為行列式是一個線性函數 det:mathrm{End}(V)
ightarrowmathrm{End}(Lambda^NV) 滿足 det T=Lambda^NT


注一:有時候考慮(非交換)除環,比如四元數環 mathbb H 形成 mathbb H-模。

參考文獻:

[1]: Michael Artin, Algebra, 2nd Edition, Pearson, 2010.

[2]: 藍以中. 高等代數簡明教程. 北京大學出版社; 2002.


推薦閱讀:

現代張量分析(1)
並矢,外積與二階張量
VIII. 重線性代數 Part 2
「廣義相對論的鑰匙:張量」專題之三

TAG:線性代數 | 張量 |