如何直觀地理解群論?
大部分同學在學習代數學時都會被一大堆的概念搞得暈頭轉向。幾年前我剛開始看線性代數時也是這樣,完全不明白為什麼要定義這些奇怪的東西。直到後來看到如何直觀理解矩陣和線性代數?理解矩陣(一)等文章,才豁然開朗。我非常認同《理解矩陣(一)》文中強調數學直觀性的觀點。那麼,應該如何直觀地理解群論?群論中一些主要的概念究竟是為什麼、怎麼樣引入的?
參考問答:
離散數學中的群在現實中有沒有什麼比較具體的例子?
群論解決問題的實例有哪些?
群論不簡單么?一個集合和一個二元運算,並且滿足群論四大公理。黑紙白字,沒有一個符號、一個漢字是我不認識的。經過這麼多年的數學訓練,加上刷題,那是想證明就證明、想計算就計算,砍瓜切菜、手起刀落、猛虎下山、勢如破竹。
但是!我很不爽,這種感覺好比有人叫你去砍人,你也不問問為什麼,一言不合就出手把人砍翻在地,或者被人砍翻在地,這種行為我們一般把它成為腦殘,你的身份就是別人的小弟。
我們不要做數學的小弟,刷題不能給我們自由,唯有思考可以。
下面就講一下我對群論的一些思考。
1 集合
講群論先從集合講起,集合簡單來說就是把一堆東西放在一起(暫時就別提羅素悖論了):
可是這用處不大啊,東西之間得有相互作用才能更好的描述世界啊:
東西我們把它稱之為對象,對象之間的互相作用我們稱之為操作或者運算。
自然數 是一個集合,我們從自然數
這個集合出發,通過運算可以創造越來越大的集合(
、
、
、
、
分別是自然數、整數、有理數、實數、複數):
運算不止加減乘除,數學學到後面就多了很多抽象運算。甚至從集合和運算的角度來看,學數學的過程很多時候就是在不斷的擴大對集合和運算的認知。理解的集合和運算越多,相關領域的數學基本上也就理解了。
其中有種特殊的集合+運算就是群。
2 群
簡單來說,群的作用是描述對稱。
2.1 什麼叫對稱?
我們來看看:
正方形對稱嗎?
物理定律對稱嗎?
多項式的根對稱嗎?
上面的問題的答案都是:對稱!
對稱就是:「某種操作下的不變性」,關鍵字是兩個:「操作」和「不變性」,要說明這點讓我們通過上面的三個問題來理解。
2.1.1 正方形是否對稱?
先看看正方形,其實它對稱是蠻明顯的,符合我們日常的語義,可是我們也要把它放到數學的語境里來分析一下:
圍繞中心點旋轉這個操作,正方形所具有的不變性就是對稱。
我們換一種操作,正方形也可以對稱:
圍繞中垂線這個操作,正方形也具有不變性,也是一種對稱。但是因為操作變了,所以這種對稱和上面的那種對稱不是同一種對稱,之後我會再說到這個問題。
假如剛才的正方形只是桌子的桌面,繼續圍繞中垂線翻轉這個操作就不對稱了:
2.1.2 物理定律是否對稱?
這個聽起來就有點奇怪了,但是從不變性的角度出發,相對於時間流逝這個操作,物理定律保持不變,我們可以說物理定律相對時間對稱。相對於空間改變這個操作,物理定律保持不變,我們可以說物理定律相對空間對稱:
這聽起來蠻哲學的,不是說數學學到後面都是哲學嗎?
物理我屬於民科水平,大家可以參看 對稱性----維基百科 。
2.1.3 多項式的根是否對稱?
說明下,多項式方程指的是形如 這樣的方程。
群論就是從解多項式的根開始發展起來的,所以自然要談一下為什麼多項式的根具有對稱性。
首先要從簡單的一元二次方程說起:
從上圖中來看,相對於 運算,多項式的根互換之後結果不變,針對這個運算它們是對稱的。對於
運算就沒有對稱性。
這個對稱性有什麼用?根據 韋達定理 ,一元二次方程 ,其中
,係數是已知的,實際上我可以聯立這樣的二元方程組求得方程的根。
所以順便說一下,群論的發展過程是這樣的:
關於伽羅瓦與一元五次方程的問題,與群緊密相關,但是又涉及到更多別的知識,本文就不繼續推下去了。
2.2 對稱如何用數學表示?
讓我們從正方形開始解讀如何來表示對稱.
之前說過,對稱最重要的是在「某種操作下的不變性」,所以我們先討論正方形圍繞中心點旋轉,總共有4種對稱操作:
或許你覺得應該不止4種操作,比如轉兩圈,這可以等價於「保持不動」,而轉45°,這會導致不對稱(因為你會明顯發現變化)。
起始點是完全不用關心的:
甚至是不是正方形也不重要:
是的,群只關心對稱最本質、最抽象的性質。所以我們只關心操作,只需要把操作放到集合里。
要放進去我們必須要把操作給數學化,也就是符號化,我們起碼有兩種符號化的選擇,類比於加法或者乘法:
稍微解釋一下,什麼叫做類比於加法?比如我們通過類比於加法得到 ,「保持不變」映射為了0,「旋轉90°」映射為了
,而兩個操作的依次進行映射為加法。所以「保持不變」 + 「旋轉90°」 =
= 「旋轉90°」,是合理。而「旋轉90°」 + 「旋轉90°」 =
= 「旋轉180°」,也是合理的。注意,運算不需要符合交換律。
還要說明的一點是,這裡的加法和乘法是模加法、模乘法,類似於鐘錶,按照12小時制算, ,
。
這樣我們就得到了兩個群,一個是 ,一個是
。但是我們明明知道它們應該是一樣的啊,只是符號不一樣,運算不一樣,所以我們可以稱之為同構,就是結構相同的意思。
這裡先用到群的解析式了,下面就要解釋一下。
2.3 群的定義
先祭出大殺器,群的標準定義:
群是一個集合
,連同一個運算"
",它結合任何兩個元素
和
而形成另一個元素,記為
。符號"
"是對具體給出的運算,比如整數加法的一般佔位符。要具備成為群的資格,這個集合和運算
必須滿足叫做群公理的四個要求:
封閉性:對於所有
中
,運算
的結果也在
中。
結合性:對於所有
中的
和
,等式
成立。
單位元:存在
中的一個元素
,使得對於所有
中的元素
,等式
成立。
逆元:對於每個
中的
,存在
中的一個元素
使得
,這裡的
是單位元。
維基百科
數學是自然科學的語言,和日常的說話相比最大的優點是精確沒有歧義,缺點就是晦澀不好理解。群的定義也是這樣,下面我們用人話來解釋群。
套用正方形的例子來解讀群的定義,選 這個群吧:
集合里的對象:所有保證對稱性的操作。
二元運算:模加法。
封閉性:操作相加還是在集合內,比如
。
結合性:
。
單位元:保持不動就是單位元,映射為0,所以
。
逆元:首先旋轉正方形的操作是可逆的,所以
,同時這還是一個循環的運算,
,都可以說是
的逆元。
其實吧,我可以再抽象一點, ,這個群基本上已經沒有原來正方形旋轉的影子了。群比我們之前學的數學的抽象性更近了一步,要不怎麼放在抽象代數課程裡面呢?本文只是想稍微讓群具體一點。
2.4 群的結構與同構
之前說過,正方形圍繞中垂線翻轉是不一樣的對稱
上圖我把運算直接表示為" "。這個群很明顯和正方形圍繞中心點旋轉的群不一樣,所以對稱也就不一樣,用群的術語來說就是,這兩種群結構不一樣。
現實中,還有各種各樣的對稱,比如正方形和圓:
這兩種對稱的結構也不同,對應的群也不一樣。群論就是對各種群的研究。
2.5 進一步的思考
關於同構,這裡再進一步思考,圓是有無數種對稱操作的,之前提到的相對於時間對稱的物理定律,也是有無數種對稱操作的(因為時間是可以無限流逝的),從某種意義上講,兩者是不是同一種對稱,也就是同構?如果是同構,那麼我只要研究一個群就可以研究兩者了。
思考,才是數學最大的樂趣所在。
最後推薦一本書,Visual Group Theory Nathan Carter,謝謝 @金凱。這書我以前看過,挺好的,就是沒有中文版,貴。
學習群的線性表示,用矩陣來理解群,一舉兩得
(群論其實比矩陣什麼的更直觀,只怕我寫不出來。)
群論是描述對稱的數學理論。
我們日常所說的對稱,大多是對於幾何圖案:正方形、正三角形、圓、立方體、球等等。如果要數一數有多少個對稱,也不難做到:長方形有兩個(左右對稱,上下對稱),正方形有四個(多了兩條對角線),圓有無數個(相對於每條直徑)。立方體怎麼數呢?
且慢,先把長方形正方形想明白。我們數的對稱都是「摺疊對稱」,或稱之為「反射對稱」 (reflection symmetry)。稍微推廣一下,對稱是我們對一個幾何圖形(或其他數學對象)所做的「作用」使得它(某種意義上)不變,而所有的這樣的對稱就構成一個對稱群(group of symmetries)。
對於長方形,「作用」可以是左右翻轉,上下翻轉,也可以轉180度,更重要的是「作用」還可以是「什麼都不做」!一定不要被中文「對稱」(或英文symmetry)迷惑而只看到「對摺」類的對稱。這種廣義的對稱有什麼好處呢?最大的好處是我們可以把兩個作用結合起來而得到第三個作用:先左右翻轉,再上下翻轉,結果是轉180度!先左右翻轉,再左右翻轉,得到的是「什麼都不做」!所以我們應該說長方形有四個對稱。
這個二元運算,很自然地符合「結合律」,用符號表示即為 (ab)c=a(bc);但交換律不成立,作用的先後很重要(如正方形的對稱群,下邊會提)。如果把群的概念抽象化(不涉及作用在某個具體的對象),就得到我們一般看到的群的定義。而群的作用可以看作是一個homomorphism:,這裡
表示所有
的雙射(如果X有某種結構的話,也規定這些映射保持這些結構,通常稱作
)。群和群的作用早期是一體的,所有的有限群都被想成是symmetric group
(含n個元素集合的對稱群,簡稱對稱群...中文表示無力)的子群,最「經典」的矩陣群都是作用在向量空間上的,直到後來群的作用發展成表示論,也是很龐大的數學分支。最新的「幾何表示論」又把群拉回到了幾何本源,但幾何已經發展的很遠了,那是後話;見 表示論都在做什麼?幾何表示論是什麼? - 數學
我們看圓的對稱,可分為兩類:我們顯然可以轉任意角度,也可以對任意直徑做翻轉。這個群顯然有無窮多個對稱,甚至不是有限生成的(finitely generated),但它其實很好描述。拓撲上這個群相當於兩個(不相連的)圓,給出坐標就很容易描述這個群的運算。這是最簡單的拓撲群,也是李群。球的對稱群(即正交群,
的正交矩陣)更複雜一點,拓撲上是某個(兩個不相連的)三維流形(manifold)。有趣的是,描述這個流形(整體結構)的最基本的方法反倒是一個群,叫基本群fundamental group。(基本群的定義更接近群的抽象公理,貌似沒有什麼「作用」,其實它的作用很大/多。)
另外提一句正多面體,我們知道只有五個(面數=4,6,8,12,20)。它們的對稱群其實很好描述,但只有作用在這些立方體上才好理解這些群的結構(有哪些子群,之間的關係等等)。而且這些群顯然都是球的對稱群的子群。
上邊提出的「廣義的對稱」其實遠遠超出幾何圖形的範疇。群最早的應用就是解決n次方程的求解,對稱群作用在方程的根上(後來解釋成作用在有理數域的擴張域上)。李群最早是用來解微分方程的,群作用在解上。另一個例子就是物理學家最愛提的對稱:作用的對象是物理定律,具體地說是可以導出運動方程的Lagrangian,而所允許的「作用」包括平移、旋轉所帶來的變化,也包括相對論的時空轉換,甚至更玄奧的gauge transformation。
續(不大好插到前邊,就寫在後邊了):
當有兩個群作用在同一個物體上,很自然地我們會問怎麼把兩個群結合起來,構造一個最小的包含兩個群的群。當然一種描述就是「包含所有群作用的任意組合」,即(有限長),
,但很可能有重複。怎樣更簡潔地描述"
"呢?(從這個角度看,現代代數與中學的代數,甚至小學的分數運算,還是有相似之處的,都是把一個複雜的式子簡化,而且關注這個簡化是不是唯一的,以便判斷兩個式子是否相等。)
情形1:兩個群的作用是可以交換順序的,如上下翻轉和左右翻轉。這樣任何一串式子都可以簡化成,群運算也很好描述。如果
,這種簡化就是唯一的。抽象起來就是兩個群的直積(direct product):
。
情形2:兩個群並不交換,如翻轉和旋轉。舉例來說對於正方形,翻轉群有兩個元素(記作,s為左右翻轉),旋轉群有四個元素(記為
,r為逆時針旋轉90度)。為了方便,我們把正方形的四角標上1234:
vs.
明顯。但是顯然
和
的作用是有某種聯繫的,不難驗證
即(終於不得不規定,這裡我們的群作用的先後是按從左到右的順序相乘)。換言之,雖然
與
不能交換順序,但如果我們不介意把
替換成
所在群的其他元素,那還是可以把一串如rssrrrsrs的式子中的s都挪到左側,使得s和r生成的群與
的八個元素一一對應。概括來說,當兩個群
和
滿足
(且
),則
和
生成的群與
一一對應,但群運算不像直積那麼簡單。這就是半直積(semidirect product),記作
(這個符號可以理解成G作用於H的變體,即G的每個元素都成了一個
的映射,即
。更準確地說,有一個群同態
,而半直積記作
)。這裡就引出群論的幾個基本概念:正規子群(normal subgroup),automorphism group,inner/outer automorphism 等等。
情形3:兩個群不交換,也不滿足一個normalize另一個,如兩種翻轉群,其夾角不是90度。這樣生成的翻轉群是很重要的一類群,不光是高維多面體的對稱群,在李代數中非常重要。這類群可以由幾個翻轉生成,滿足的關係是
,其中
(因為
是翻轉)。這些
並不是可以任意取的,而要對應
和
的夾角。這樣生成的群包括一串類似
的式子,沒有同樣的生成元相鄰,但還能進一步簡化。如
兩邊各有
項,這樣替換之後可能會消項,式子就變短了。不幸的是,我們沒有唯一的簡化,但最簡的式子都一樣長。
很多人提到對稱,其實是不對的。
群的特徵是變換,任何封閉的變換操作集都可以用群表示。物理里用它來表示對稱,是因為對稱操作總是某種變換操作,而且肯定是封閉的,所以必然成群。
但是即使不是對稱操作,也可以是群。一個旋轉對稱明顯破缺的理論,同樣可以討論旋轉群的作用。
從我接觸的一些知識中,簡單的說說:
用數學語言嚴格定義的群,是我們實際中遇到的問題的高度抽象。為了更好的理解這些概念,用「轉動」會更方便些。
1. 「轉動」這個東西在物理和數學上都很普遍。我們直接看得到的,平面/三維空間中把某個位置矢量繞原點轉動有限的角度;剛體繞某個固定軸的轉動;當平面/三維空間坐標軸轉動某個角度後,溫度場的變化;平面/三維空間中坐標軸轉動後,速度場的描述有什麼變化;物理中的,標量場,光子場,Dirac場在坐標旋轉後,如何描述。
2. 緊接著,就要區分「操作」和「對象」的概念。1中的位置矢量,剛體,溫度場,速度場,標量場,光子場,Dirac場都是具體的」對象「,我們把他們繞固定點轉動,繞固定軸旋轉就是」操作」。我們當然可以直接操作這些客體,叫「主動操作」;也可以去操作坐標軸,而讓客體被動的發生改變,因為要描述客體,必須建立一套坐標軸,叫」被動操作「。
3. 這些」操作「被提煉出來,就是群的概念。如果僅僅到此為止,那麼他們也僅僅是些符號而已,但是如果給這些」操作「賦予對象,那結果就立即豐富起來了。3D空間的轉動操作,可以作用到位置矢量上,體現為矩陣;也可以作用到標量函數上,矢量函數上,Dirac函數上,。。。。。體現為算符。這個過程,叫做求」群的表示「。當然,從數學的角度,就是要確定」表示空間「,然後求」群的表示「。數學上的表示空間,可以是x,y,z這樣的3D空間,複數空間,也可以是完備的函數空間(球諧函數為基底,多項式為基底。。。)等等。這裡其實並沒有嚴格的區分」算符「和」矩陣「。
4. 我們最感興趣,最能看得見的操作是3D空間的轉動操作,比如轉動一個位置矢量。我們一般需要求繞一個任意固定軸
越寫越多,以後慢慢寫。。。
遵循阿爾諾德,一個群就是某些對象的自同構
按照凱萊,一個群就是一種幾何對稱
群論討論的東西, 要麼是這個東西本身符合群論定理(這玩意的數學結構就這樣), 要麼是這個東西是從某個群作用中抽象出來的. 如果想找具體的例子的話, 那本物理中有一堆抽象出來的群作用, 比如 Galileo 變換群, Lorentz 變換群.
我們常常聽說的群論是刻畫對稱的, 說的也是同樣的事情. 比如說在中的矢量構成的集合, 我們把它繞著一端旋轉的操作, 抽象成群
(這樣的變換符合群定義). 常見的群, 比如說置換群
, 或者循環群
, 或者二面體群
都可以從群作用的觀點上非常直觀的理解.
繼續說旋轉. 其實我們在線性代數中可以用矩陣來刻畫這樣的操作, 可另一方面顯然這是個旋轉群. 譬如平面上的情形, 和對應的旋轉群
. 說後者是矩陣群, 即是使用前面的那樣的變換構成的群. 當然沒錯, 可實際上這樣的旋轉操作是抽象的是, 是和基的選取無關的. 前面的矩陣是後面的群的表示(Representation). 這樣的從抽象群出發, 到某一類可逆矩陣的同態關係, 被稱為群表示.
所以, 群論還是很形象和直觀的理論.
建議各位答主在回答完以後把參考文獻放上來
台灣交通大學朱超原老師,開放式課程化學應用群論,在開始的幾節課簡單詳細的介紹了抽象群的規則以及由來,非常有趣,精彩,易懂.
首先,對於不需要直觀就能理解的群的同學深表佩服。其次,說下我對群的直觀理解。群定義相信大家閉著眼就能寫出,上文也有,不再贅述。幺元、逆元運算的直觀對稱性很明了。這裡著重說一個結合律的對稱性。以二維空間向量加法為例,對於(a+b)+c=a+(b+c),設a+b=d,b+c=e,令a+(tx,ty)=d,則一定有e=c+(tx+ty),兩邊相加,消去(tx,ty),得d+c=a+e,即(a+b)+c=a+(b+c).對於1維數軸亦同。其實,要想直觀,就用數形結合法,上述給圖,二元加法結合律對稱性一目了然:
c和a分別用對稱的(tx,tx)補一下,結合律就等價對稱了。
說真的,呢個所謂的直觀理解矩陣不就是在線性代數的抽象體系里理解矩陣?從來不覺著數學是一個需要直觀得東西,體系完整自然醍醐灌頂。
從起源來說,似乎最早的群是用來描述幾何對稱的,舉個例子:
比如一個正方形,關於對稱軸翻轉,關於中心旋轉90度等變換,得到的"位置不變的"正方形。只是各頂點位置變了。
假設正方形為:
A B
C D
逆時針轉90度就是:
B D
A C
這個旋轉可以對應於一個定義在{A, B, C, D}上的變換f,滿足:
f(A)=B, f(B)=D, f(C)=A, f(D)=C
所以旋轉、翻轉可以看成正方形四個頂點構成的集合上的變換。把這些變換收集起來,構成一個變換的集合,可以證明這個集合關於變換複合作為乘法是一個群,我比較喜歡叫變換群。
而實際上有一個更強的結論,就是Cayley定理,不正式地說,Cayley定理證明了: 任意一個群都形式上等同於某一個變換群。
================ 2015-10-29 ==================
所以我見過的很多群都是大量變換構成的群。舉一些例子:
最好的例子莫過於全體n*n矩陣構成的群:如果理解矩陣和線性變換的關係的人會知道:矩陣代表的就是(在固定一個坐標系下)一個線性變換的數值表示。簡單說,矩陣就是線性變換。
那麼全體n*n矩陣構成的群也就是變換構成的群。(驗證四條定義我就不驗證了)
而且線性變換群還有很多子群,比如正交變換(剛性變換)構成的群,還有非退化變換(秩大於0的矩陣)構成的群。等等。
再舉一個例子,就是變換群,考慮一個有限集S = {1, 2, ... , n}。 S到S上的所有雙射也是構成了一個群(四條定義也不驗證了),這與前面正方形翻轉是一個東西。就是自同構群,或者說對稱群。
同樣的對稱群也有很多子群,比如偶變換構成的群。
在物理學裡面還有很多群,我不太熟悉,但應該也和變換有關係。3B1B 最近有一期 講了一點點群論 推薦 去看看
推薦一本書,visual group theory 就是用來直覺理解群的。
配套同名視頻 b站上就可以找到 b站或油管直接搜visual group theory
雙射
不是很理解你們為什麼一定要用一個「本質」去說數學的東西,全都是人造的哪來本質不本質,數學是自然科學嗎?
不妨玩玩魔方
推薦閱讀:
※既然數學知識是全球共有的知識,為什麼中國還要搞數學研究?
※如何評價「中國奧數和競賽培養不出數學家」的觀點?
※函數連續和一致連續有什麼區別?開區間上的連續函數不一定是一致連續的,為什麼?
※既然微分和積分互為逆運算,為什麼積分比微分更難求解?
※怎樣學數學才能達到省級競賽一等獎的水平?