《粒子物理學中的李代數》讀書筆記2

《Lie algebras in particle physics》是很久以前在知乎提問「有什麼群論方面的好書?」zhihu.com/question/2812時別人推薦的書,不過因為懶一直沒有看。這次決定看至少3章,寫筆記是為了讓自己能做一些深入的思考,而不是只流於表面的翻閱。

  建議配合原書Lie Algebras in particle physics進行閱讀。我很好奇沒有相關知識和書本的讀者只看我寫的內容是否看得懂,如果真有讀者的話可以反饋一下(個人覺得要讀懂只需要知道群的表示是什麼就可以了。當然,默認對線性代數有個起碼的了解)。

  目前更新了原書2.1-2.5節(前半段)相應的內容。

  從第二章「Lie Groups"開始寫起(第一章以後補吧,現在覺得只要知道表示是什麼就可以看懂第二章了。離散群的東西對我用處似乎不大。)

  G是群。我們研究這樣的群,G內的群元素gin G可以與(一個或一組)參數alpha建立聯繫(我理解這裡的聯繫為「一一對應」。下文所有個人理解都可能有誤。),並且這個聯繫是光滑的。這裡的光滑是指,我們有某種方法來定義群內的元素是否「靠近」。在給定了這種定義方式後,如果兩個群元素足夠「靠近」,那麼他們的參數也足夠靠近,滿足這樣的條件我們就把這個群元和參數的聯繫叫做「光滑的」。

  此章內除非有特殊情況,否則都只考慮這樣的群。此章節中說到「一個群XXX」時候,我們默認是這種群。

  2.1生成元

  我們來研究怎麼取定參數。群內肯定有一個恆等元,很自然的,人們會把這個恆等元

對應的各個參數取為0。比如我們把平面旋轉變換與旋轉的角度(參數)對應起來,那麼恆等變換就對應著旋轉0(參數)度。

  恆等元對應的表示為恆等矩陣。用D代表表示,那麼D(alpha)|_{alpha=0}=1(1代表恆等矩陣)。參數是光滑的,所以我們可以在恆等表示附近把表示相對於參數進行小量展開:D(dalpha)=1+idalpha_aX_a+...其中a代表參數的序號(第a個參數),式子中使用了愛因斯坦求和約定。式中X_a=-ifrac{partial}{partial alpha_a}D(alpha)|alpha=0被叫做群的生成元。如果群里的各個參數都是必要(少了某個參數就無法完整描述這個群了)的,那麼各個參數對應的生成元是獨立的。生成元中引入虛數i是為了使得當表示是幺正的時候,生成元為厄米的。

  上面的生成元是通過群的表示來定義的。Sophus Lie展示了生成元實際上可以不通過表示,而直接在抽象群中定義。在物理中我們更專註群的表示而不是群本身(洛倫茲群的不同表示對應著不同的物理內涵)。

  到現在為止,實質上我們只定義了群內恆等元所對應的參數,而其他群元素的對應的參數目前有巨大的自由度。比如平面旋轉群,我們一般把旋轉角alpha的變換對應的參數取為alpha,但實際上我們也可以取為alpha^2,這樣定義的參數,一樣滿足光滑與「恆等元對應於0」這兩個條件。

  在這巨大的自由度中,我們採用這樣一種參數化模式,使得群元相乘對應的參數形式儘可能簡單。我們採用被稱為exponential parameterization的參數化方式。這裡的重點是,exponential parameterization定義出來的,而不是通過某種方式推導出來的(當然,很多物理內容剛好符合這個定義)。

exponential parameterization是這樣定義的。對於足夠小的參數對應的群元(實質上是群元的表示,畢竟雖然Sophus Lie展示了生成元可以不通過表示來構造,但是這本物理書上並沒有這方面內容),我們已經知道D(dalpha)=1+idalpha_aX_a。那麼現在我們怎麼定義D(alpha)呢?我們把alpha視為N(N很大)個小量frac{alpha}{N}的和。因為frac{alpha}{N}是小量,所以已經由之前關於生成元的式子定義了。現在我們定義D(alpha)=(D(frac{alpha}{N}))^N。這個定義寫成公式即是書上的:

D(alpha)=lim_{k
ightarrowinfty}(1+ialpha_aX_a/k)^k=e^{ialpha_aX_a}

  也就是說,我們只要知道在恆等元附近的一個任意小臨域內的參數對應情況,我們就可以定義出在一個大區間內的參數對應情況。

  舉個例子,某個群的群元(的表示),按照exponential parameterization對應於兩個參數。那麼參數比如說(5,3),對應的是哪個群元呢?我們令X_1對應第一個參數的生成元,X_2對應第二個參數的生成元。那麼D(5,3)approx(1+0.05iX_1+0.03iX_2 )^{100}approx(1+0.005iX_1+0.003iX_2)^{1000}=lim_{k
ightarrow infty}(1+5iX_1/k+3iX_2/k)^k=e^{i(5X_1+3X_2)}

  最後補充兩點:1.上文定義了a(a是參數數量)個生成元。而實際上,在以這a個基矢張成的線性空間中的每一個矢量都被叫做生成元。

2.上文中的等式D(alpha)=lim_{k
ightarrowinfty}(1+ialpha_aX_a/k)^k=e^{ialpha_aX_a}中的第二個等號需要解釋。矩陣的函數是通過指數展開來定義的,因此第二個等式並不是微積分中那麼顯然的。不過實際上,我們可以先把矩陣對角化,那樣就可以看出來和自變數為「數」的情況一樣,矩陣情況下這個等式也是成立的。

  2.2李代數

  我們用exponential parameterization 定義了一種將群元素和參數聯繫起來的方法。這個方法有沒有用,要看我們物理中實際使用的參數化方法是否是恰好符合這套定義的——實際上我們使用的各種參數化方法,大多數滿足這套定義的。這是為什麼呢?

  (以下6段為個人理解)

這是因為,exponential parameterization(下文為了方便,有時會用中文「指數參數化」取代這個詞)方式將群參數化,實際上是與一個條件等價的(互為充分必要)。這個條件就是,如果兩個群元,對應的各個參數成正比,那麼這兩個群元的乘積對應的參數,就為這兩個群元各自的參數之和(下文把這個條件成為正比參數可加)。

  也就是說,(論斷A)如果一個群的參數滿足這個條件,那麼就可以寫成指數參數化的形式,反之亦可。

  什麼叫兩個群元的參數成正比呢?比如兩個群元的參數是(1,2)和(3,6)那就是成正比的,(1,2)和(3,5)就不是。我們可以看出一個很顯然的事實,就是如果一個群只有一個參數,那所有群元對應的參數都是成正比的,所以單參數群,滿足指數參數化Leftrightarrow 群元素的乘積的參數等於相乘的各個元素的參數的和。因此,對於平面旋轉群(參數為旋轉角),很顯然這就是一個滿足指數參數化的例子。

  下面我稱述一下為什麼論斷A是成立的。我用一些直覺化(土鱉)的說明方式而不是用更嚴格形式化的數學推導(因為不會)。

  指數參數化Rightarrow 正比參數可加:假設兩個群元對應的參數是(1,2)和(3,6),由於滿足指數參數化,所以兩個的表示approx(1+0.001X_1+0.002X_2)^{1000},(1+0.001X_1+0.002X_2)^{3000},這裡為了顯然用0.001等數字代表小量。這兩個相乘,很明顯就是approx(1+0.001X_1+0.002X_2)^{4000},對應於參數(4,8)。

  正比參數可加Rightarrow 指數參數化:腦子裡想了一下,如果沒有什麼奇異情況的話應該不難。不寫出來了(費馬當年也是這麼想的)。

  正比參數可加,但是如果兩個群元對應的參數不成正比,那一般就不能把乘積對應的參數簡單的認為是相乘的兩個群元的參數的和。參數為(1,2)的群元素乘以參數(2,3)的群元素,得到了群元素的參數一般不是(3,5)。書上將這寫為:e^{ialpha_aX_a}e^{ieta_bX_b}
e e^{i(alpha_a+eta_a)X_a}。群的所有元素的表示,都可以寫成生成元的線性組合的指數。現在需要做的,就是得到這些線性組合的係數(這些係數對應於參數),也就是,設e^{ialpha_aX_a}e^{ieta_bX_b}=e^{idelta_aX_a}(愛因斯坦求和約定),求delta_a

  書中接下來通過將等式兩邊展開成級數來求delta_a。書中說,「When we do this,something interesting happens.」:只有當生成元在對易下形成「代數」的時候,我們做的東西才是成立的。(原文:We find that it only works if the generators form an algebra under commutation(or a commutator algebra).)

  接下來是我個人對這段話的理解。首先,文中的代數是什麼意思呢?查閱wiki得到代數的定義:

en.wikipedia.org/wiki/A

簡而言之,代數就是線性空間(已經定義加法和數乘),配合上一個雙線性的乘法。

  那麼,對易(所謂A,B的對易就是AB-BA)構成代數這是什麼意思呢?雙線性不是顯然的嗎?為什麼書上還要煞有介事地說"something interesting happens"呢?問題的關鍵其實不在於雙線性,而在於定義中的第一句話,A 	imes A to A,也即空間內兩個元素的乘法運算,仍然在該空間里。這一點並不是顯然的:比如,我們也可以定義生成元的乘法為它們之間直接進行矩陣乘法。這樣的定義也是滿足雙線性的,然而得到的結果未必在生成元空間內。總而言之,我們對生成元配合上對易作為乘法,構成了一套代數,我們稱之為「李代數」。

  因為構成代數,所以我們可以把生成元的乘法,按照生成元的基進行展開。寫成數學公式即有:[X_a,X_b]=if_{abc}X_c。和之前一樣,i是為了方便取的,式子中用了愛因斯坦求和約定。這個看似顯然的式子是因為之前我們說的A 	imes A
ightarrow A才成立的。我們不能把X_aX_b展開成ig_{abc}X_c,因此X_aX_b未必在生成元空間內。f_{abc}被稱為結構常數。

  接下來書上開始兩邊展開e^{ialpha_aX_a}e^{ieta_bX_b}=e^{idelta_aX_a}delta_a,把很多對標量的函數運算全搬過來了。要一一驗證這些式子在矩陣情況下是否成立太麻煩了,所以一筆糊塗賬我們就按只要不交換乘法順序,就都當它成立來搞。書上展開到二階,得到

idelta_aX_a=ialpha_aX_a+ieta_aX_a-frac{1}{2}[alpha_aX_a,eta_bX_b]+...

省略號代表高階項。顯然我們只要知道結構常數,就能得到delta_a展開至兩階的結果。那麼再往下呢?展開到更高階我們是否需要知道更多的信息?就好像如果我們泰勒展開到第二項需要知道一階導數,到第三項需要知道二階導數一樣?數學定理告訴我們,只要知道結構常數就足夠了,只要知道結構常數就能把delta_a展開到任意階。在指數參數化的意義下,只要我們知道了生成元之間的結構常數,我們就把群的的參數在群乘法下的對應關係確定下來了!

  最後需要明確,結構常數只和群本身有關,和群選擇哪種表示是無關的。

  本節書中最後一段,陳述了如果代數存在幺正表示,那麼結構常數是實數。這裡我有些疑問,什麼情況下代數存在幺正表示呢?(似乎書中處理的所有群都是默認有幺正表示的。)

2.3雅可比等式

  生成元滿足[X_a,[X_b,X_c]]+[X_b,[X_c,X_a]]+[X_c,[X_a,X_b]]=0

  這節的內容很簡單,沒什麼地方需要思考的。

  2.4共軛表示

  可以利用結構常數構造一套表示,這個表示叫做共軛表示。要定義這套表示,我們就要給出第a個生成元對應的矩陣T_a。我們定義矩陣T_a的第b行c列為:

[T_a]_{bc}=-if_{abc}

通過數學運算可以得到,[T_a,T_b]=if_{abc}T_c,所以T是生成元的一套表示。

  要證明上式,就要證明[T_a]_{mp}[T_b]_{pn}-[T_b]_{mp}[T_a]_{pn}=if_{abc}[T_c]_{mn}

即:-f_{amp}f_{bpn}+f_{bmp}f_{apn}=f_{abc}f_{cmn}

  利用雅可比等式(見書),可以得出上式是成立的。於是T是生成元的一套表示。

  表示的維數定義為作用的線性空間的維數,共軛表示的維數和獨立生成元的個數相同,與群元對應的實參數數量也相同。

  我們希望給生成元的共軛表示定義一個內積,讓其變成一個線性空間。定義內積為兩個表示相乘的跡Tr(T_aT_b)。接下來,我們需要確定,這樣定義的內積,不隨基選取的改變而改變。

  比方說,我們一開始選擇生成元的基為X_1,X_2,...X_n,隨後根據[X_a,X_b]=if_{abc}X_c中的結構常數f_{abc}來構造X_a對應的共軛表示矩陣T_a。知道了所有生成元的基的表示矩陣,那麼自然就可以通過線性疊加得到生成元空間中任意的元素對應的共軛表示矩陣T。比如2X_1+X_2對應2T_1+T_2

  現在我們換一組基X_1,X_2,...X_n,隨後根據按同樣的步驟得到f_{abc},然後再構造出X_a對應的T_a,最後得到生成元空間中所有元素對應的共軛表示——當然其中也包括舊的基X_1,X_2,...的共軛表示。不過,即使同一個生成元同一個基,在前後兩種表示中的矩陣也是不同的。

  字母太複雜,我們用數字實例來說明。假設一個生成元空間中有三個基X_1,X_2,X_3,對易關係為[X_1,X_2]=X_1+2X_2+3X_3,[X_1,X_3]=2X_1+3X_2+4X_3,[X_2,X_3]=3X_1+4X_2+5X_3

T_1left(egin{array}{ccc}0&0&0\-1&-2&-3\-2&-3&-4end{array}
ight),T_2left(egin{array}{ccc}1&2&3\0&0&0\-3&-4&-5end{array}
ight)T_3left(egin{array}{ccc}2&3&4\3&4&5\0&0&0end{array}
ight)

現在我們取一組不同的基X_1,X_2,X_3,其中X_1=X_1-X_2,X_2=X_1+X_2+X_3,X_3=X_1+X_2-X_3

我們可以反解得X_1=frac{1}{2}X_1+frac{1}{4}X_2+frac{1}{4}X_3,X_2=-frac{1}{2}X_1+frac{1}{4}X_2+frac{1}{4}X_3,X_3=frac{1}{2}X_2-frac{1}{2}X_3

我們可以求出對易關係,[X_1,X_2]=-X_1+frac{7}{2}X_2-frac{3}{2}X_3,[X_1.X_3]=-X_1+frac{11}{2}X_2-frac{3}{2}X_3,

[X_2,X_3]=2X_1-15X_2+3X_3

接下來寫出結構常數f,並據此求得X_1,X_2,X_3對應的共軛表示:

T_1left(egin{array}{ccc}0&0&0\1&-frac{7}{2}&frac{3}{2}\1&-frac{11}{2}&frac{3}{2}end{array}
ight),T_2left(egin{array}{ccc}-1&frac{7}{2}&-frac{3}{2}\0&0&0\-2&15&-3end{array}
ight)T_3left(egin{array}{ccc}-1&frac{11}{2}&-frac{3}{2}\2&-15&3\0&0&0end{array}
ight)

最後,我們可以求出老的基X_1,X_2,X_3在新基下的共軛表示,為

T_1left(egin{array}{ccc}-frac{1}{2}&frac{9}{4}&-frac{3}{4}\1&-frac{11}{2}&frac{3}{2}\0&1&0end{array}
ight),T_2left(egin{array}{ccc}-frac{1}{2}&frac{9}{4}&-frac{3}{4}\0&-2&0\-1&frac{13}{2}&-frac{3}{2}end{array}
ight)T_3left(egin{array}{ccc}0&-1&0\-1&frac{15}{2}&-frac{3}{2}\-1&frac{15}{2}&-frac{3}{2}end{array}
ight)

我們看到,舊基在新基下的共軛表示與先前的不同,但T_1,T_2,T_3的跡是與原先一樣的。同樣的,T_1 T_2,T_1T_3,T_2 T_3雖然新舊錶示中不同,但它們的跡是一樣的。因此,兩個生成元在不同共軛表示中的乘積的跡不變,因此Tr(T_aT_b)可以作為生成元內積的定義。

  接下來的任務,就是選擇一組正交基,即在這組基中,不同的基的內積為0。原書上給出了一連串的推導,告訴我們,如果把Tr(T_aT_b)視為一個矩陣的a行b列元素,那麼這個矩陣在基的線性變換下做相似變換,就像線性代數中線性映射在不同基的情況下做相似變換一樣。這樣,我們就可以想辦法把Tr(T_aT_b)對角化,也即找到正交基。

  首先,Tr(T_aT_b)是實對稱矩陣,所以可以通過正交矩陣進行相似變換對角化(這是線性代數中一個定理)。現在我們證明Tr(T_aT_b)在基做正交變換時做相似變換,從而可以對角化:

X_a
ightarrow X_a=L_{ab}X_b為基的變換。那麼[X_a,X_b]=iL_{ad}L_{be}f_{dec}X_c=iL_{ad}L_{be}f_{deg}L^{-1}_{gc}X_c

[T_a]_{bc}=L_{ad}L_{be}[T_d]_{eg}L^{-1}_{gc},即[T_a]=L_{ad}L[T_d]L^{-1}

也就是T做一個相似變換後再做一個和基的變換一樣的線性變換。我們關注的不是T_a而是Tr[T_aT_b]的變換,因為相似變換不影響跡,所以

Tr(T_aT_b)
ightarrow Tr(T_aT_b)=L_{ac}L_{bd}Tr(T_cT_d)。我們只考慮L為正交變換,那麼上式最右邊就等價於L_{ac}Tr[T_cT_d]L^{-1}_{db},一個正交相似變換。又因為實對稱矩陣可以通過正交矩陣進行相似對角化,所以上述變換可以讓我們把Tr(T_aT_b)對角化為Tr(T_aT_b)=k_adelta_{ab},式中沒有使用求和約定。

還可以繼續用對角矩陣LTr[T_aT_b]一些變換,改變所有非0的k^a的大小,比方說讓所有非0k^a有絕對值1。不過這樣的變換中我們無法改變k^a的符號,因為實際上我們是對每個對角元乘以某個數的平方的。

  假設所有的k^a都是正的,那麼這種李代數叫做緊李代數(compact Lie algebras).書中用的都是基本都是這種李代數。書中偶爾會講講某些k^a是0的李代數。而有些k^a是負數的李代數,沒有非平凡的優先維幺正表示,這不表示他們沒用(比如洛倫茲群),不過這本書里不會討論它們。

  我們取Tr(T_aT_b)=lambdadelta_{ab}。在滿足這樣條件的基下,結構常數是完全反對稱的:[T_a,T_b]=if_{abc}T_c,兩邊同時乘以T_c並取跡。因為不同基對應的共軛矩陣相乘的基為0,所以

f_{abc}=-ilambda^{-1}Tr([T_a,T_b]T_c)。利用跡的性質Tr[AB]=Tr[BA],可以得到f_{abc}=f_{bca}(見書推導2.39,我看的版本書上中間兩個式子漏了Tr),最後和對所有情況下結構常數都滿足的f_{abc}=-f_{bac}聯合起來,就可以得到f_{abc}=f_{bca}=f_{cab}=-f_{bac}=-f_{acb}=-f_{cba},即完全反對稱。因為f_{abc}的反對稱性,以及T是純虛數矩陣,可以很容易得看出在這樣的基中T是厄米的。書上還說了T是幺正的,這句不是很理解,懷疑是筆誤。

2.5簡單代數和群(simple algebras and groups)

  不變子代數是指部分生成元構成的子集,這些子集內的元素與全集的元素對易後得到的依然是這些子集內的元素。當對不變生成元取指數,生成一個不變子群(不變子群:對任意元素g,左陪集=右陪集)。

  也就是說,對於群的任意元素g=e^{iY},Y是任意生成元,X是子代數中的生成元,有g^{-1}e^{iX}g=e^{iX},X也是子代數中的元素。

  證明這個結論:首先可以得到X=e^{-iY}Xe^{iY}。這一點只要帶入之前的式子就可以驗證(並且一個群元對應的生成元具有唯一性)。接下來證明X=X-i[Y,X]-frac{1}{2}[Y,[Y,X]]+...。我們令X(epsilon)=e^{-iepsilon Y}Xe^{iepsilon Y},X(1)即為X,把X(epsilon)做級數展開,最後帶入epsilon=1,就可以得到

因為對易之後依然在子代數中,所以X也在子代數中。命題成立。

  整個李代數和子集0是平凡的不變子代數。如果這個李代數沒有其他的子代數,那麼就叫做簡單(simple)的。簡單的代數生成簡單群。

一個簡單李代數的共軛表示如果 滿足Tr(T_aT_b)=lambdadelta_{ab},那麼這個表示是不可約的。證明沒有看懂,留待日後解決。

  我們經常會用到特殊阿貝爾不變子代數,它裡面的生成元和這個李群的生成元都對易。我們把這個子代數稱為群的U(1)因子(個人理解的定義)。如果X_a是U(1)內的生成元,則它的結構常數均為0,所以我們不能通過結構常數來區分U(1)內的元素。

沒有阿貝爾不變子代數的代數被稱為準簡單(semi simple)的。他們由幾個簡單代數合在一起構成。

2.6態和算符

  生成元的表示可以理解為矩陣(之前都是這樣),也可以理解為一個線性變換,它作用在某組基上|1
angle,|2
angle,...|n
angle上,滿足X_a|i
angle=|j
angle[X_a]_{ji}

  在表示作用的希爾伯特空間中,群元素對應著對態的變換。

|i
angle
ightarrow |i
angle=e^{ialpha_a X_a}|i
angle

算符也會相應的變換。

變換後算符在新基下的矩陣不變:langle i| O|j
angle=langle i|O|j
angle

2.7 Fun wwith exponentials.

這一節主要給出一個公式:frac{partial}{partialalpha_b}e^{ialpha_aX_a}=int_0^1dse^{isalpha_aX_a}(iX_b)e^{i(1-s)alpha_cX_c}這個式子的意思是積分出來的項iX_b會出現在式子任一處,所以把各個位置的情況積分起來。

到此第二章的筆記寫完了。一些內容還有待進一步完善,但總體來說這一部分內容已經理解了。


推薦閱讀:

規範對稱的諾特流,一點點圖森破的小想法和小總結
中國數學物理定理——數學物理暴力美之源
網路物理那些難以解決的問題
物理學史拾遺(一)絕熱不變數專題:從玻爾茲曼到量子力學(下)
創新電子理論(原創)

TAG:物理學 | 群論 | 理論物理 |