Gauss與AGM(VI-2)
[題圖來自Gauss1805年的筆記Scheda An (見Gauss全集第十卷第二冊,102頁-103頁),筆記的題名為Cereri, Palladi, Junoni sacrum。根據Gauss日記的記載[Gauss日記122條],Gauss在1802年-1804年一直忙於天文觀測及其相關計算,直到1805年Gauss才返回到純粹數學的研究上來。這一張圖來自Scheda An 的第7頁。在Scheda An 的第8頁上有Gauss寫下的模形式 滿足的若干函數方程。根據這些記載以及Gauss日記的記錄,Gauss全集第十卷的編輯Schlesinger斷定,Gauss在1800年左右就知道下面提及的模形式 的函數方程,而Gauss直到1805年左右才開始著手研究與 相關的同餘子群的基本區域,Scheda An 上的這張圖正是這些基本區域的示意圖。這一非常重要的概念從未落到Abel和Jacobi的手中,直到Riemann把它"發展為自己理論中受到鍾愛的工具"(見Klein《數學在19世紀的發展》第一卷,齊民友譯,38頁)。Gauss的基本區域與我們通用的記法不同之處在於,他的基本區域是我們通用的基本區域順時針旋轉90度以後得到的圖形。在下文中我們一概採用現代記法而不採用Gauss的記法。]
前情提要:Gauss所發現的函數
都是上半複平面 上的解析函數,而且它們都滿足某些對稱性,這些對稱性可以由函數方程刻畫,例如
那麼我們應當如何刻畫 的所有可能的對稱性[換言之,這些函數在何種變換群下保持不變]?這些對稱性與複數AGM的迭代過程有什麼關係?這是我們本篇集中探討的內容。
1861年Gauss的學生兼密友Johann Franz Encke曾經提及過他與Gauss的幾次私人談話,在談話中Gauss強調,數學乃是「視覺的科學」(eine Wissenschaft für das Auge )[原文見Kronecker全集第五卷,391頁]。遵循Gauss這個觀點,我們就必須引入複平面這個幾何工具,它對於我們理解 及其背後的模形式大家族有著至關重要的作用。
Ex. 函數 滿足以下函數方程:
它們刻畫的正是 在線性分式變換 以及 作用下所滿足的"對稱性"。我們對這些變換進行複合,就可以導出更多的函數方程。那麼這些函數方程的具體形式是什麼?
我們知道,線性分式變換中的"線性"二字來自於以下事實:兩個線性分式變換的複合等價於兩個 非奇異矩陣的複合。因此,線性分式變換 與 [及其逆]的所有複合等價於 與 生成的群。這意味著,這些線性變換的複合都是下面的線性分式變換群的元素[這就是著名的modular group ]:
進一步觀察我們可以看出,除了要求 以外,我們其實還得要求 均為偶數。所有滿足 , 均為偶數的整數矩陣 在矩陣乘法下也構成一個群,我們稱之為層次2的主同餘子群(principal congruence subgroup of level 2,這是源自Klein的術語,通用記號為 )。
一個自然的問題是: 與 生成的群與 之間的關係是什麼?我們可以用代數方法[輾轉相除法]和幾何方法兩種方法來解決這個問題。兩種方法中幾何方法涵蓋了更多的信息,所以我們把代數方法放在一邊,把注意力集中在這個問題的幾何方法上。
線性分式變換群
最自然的作用對象是上半平面 。上半平面的任意一點在這個群的作用下都有無窮多個像點,如下圖所示:
空心圈點是上半平面的點 在這個群作用下的像。直觀看來,這些像點是越來越接近實軸的。換言之,在群的作用下,上半平面上的點 的虛部趨於0。這一點很容易用代數計算來證實。通過計算我們可以得到 。 是離散的整數,當 中的一者趨於無窮,那麼 的值必然趨於0。這一觀察還帶來一個結論,那就是對於給定的 , 存在最大值。
上面的推理一樣適用於 與 生成的群與 。我們記前者為 ,那麼上半平面上總存在點 ,它的虛部不小於它在 作用下的所有像點的虛部。據此我們可以得知,
,也就是 。由於 作用並不改變 的虛部,因此我們可以把 的實部限制在 到 之間[為什麼?]。因此,我們就得到了以下的上半平面的區域 的圖像:
[註:Gauss在1827年的筆記中(見Gauss全集第三卷,477-478頁)明確地給出了這個基本區域的圖形,然而Gauss全集的第一任編輯Schering完全沒理解Gauss的意思,把這個圖畫錯了。直到1898年Klein負責主持Gauss全集的編輯工作以後,這個錯誤才由Robert Fricke更正過來(見Gauss全集第八卷,105頁)。]
我們可以根據這一觀察來導出 與群 之間的關係。根據上面的推理,我們如果取區域中 的點 ,並任意取 ,那麼我們總能在 中找到元素 ,使得 也屬於這一區域。我們取 中的點 ,並且記 ,我們就會得到限制
這些約束條件給出的唯一可能就是 , 是單位矩陣[為什麼?],因此我們已經導出,線性分式變換 與 是線性分式變換群
的生成元。
上面的推理奠定了我們本篇內容的基石。這一推理可以產生以下的推論:
- 任意給定上半平面 中的一點 ,我們總可以找到 ,使得 落在我們指定的區域 內。這一區域 我們稱之為 的基本區域(Fundamental Domain, Fundamentalbereich);
- 與 生成的群並不是 ,而是它的一個指數為2的子群,這個子群同構於 ,或者可以說,它的元素是 中滿足 的矩陣 。我們記這個群為 。通過歸納法可以證明,給定 ,我們有 這是我們在這一系列中真正展示的第一個模形式。
- 注意到 ,藉此我們可以得到[為什麼?]:給定 ,有 這是所謂的帶有乘子(multiplier)的模形式。從這裡我們可以看出,如果 且 ,那麼我們有 。所有這樣的矩陣依然構成一個群,我們稱之為 。這個群的基本區域完全可以用與 一致的方法導出。具體可以寫為 。
[請讀者思考: 在 作用下滿足什麼樣的函數方程? 在我們提到的各種群(尤其是modular group )的作用下又是如何變化的?(Gauss當然知道這些問題的答案[參見Gauss全集第十卷第一冊,224頁])]
我們不清楚Gauss的推理過程是否與我們的推理重合。儘管我們不知道Gauss具體的推理過程,但已有的材料傾向於表明:Gauss知道上面我們寫下的所有結論,絕大多數思想成型的時間不會晚於1827年,最基本的思想更是早在1800年或1805年就已經成型,可惜的是他始終沒有把自己的思想寫成文章,我們所看到的只是思想的斷片而已。
經過漫長的鋪墊以後,我們才能嘗試去解決Gauss的問題:
******************************************************************************************
問題:給定迭代的初值 [我們捨去 或 的平凡情形]。迭代過程由
確定。由於複數域上的分數次冪是多值函數,因此一般每次迭代會產生兩個不同的 的值。我們想要知道,這一迭代過程所有可能的極限值是什麼。
******************************************************************************************
我們仍然可以從上一篇的toy model的分析過程中獲取靈感。上一篇中對於toy model中的絕大多數分析都可以直接用到Gauss的問題上去。
- 我們仍然規定"好的"複數對 滿足 。如果定義 ,那麼 依然是單調遞減的,從而存在極限;
- 如果 是"不好"的,那麼我們有 對某個嚴格小於1的正實數 成立。因此如果迭代中有無限多對 是"不好"的,那麼迭代的極限必然是0。[其實我們可以定 ,請讀者推理一下,這個值是怎麼來的?];
- 序列中只有有限多對"不好"的 的情形是我們需要重點考察的對象。Gauss早在1810年左右就計算過這樣的序列[見Gauss全集第十卷第一冊,219頁],他的計算顯示,取初值 ,如果只有第一次迭代是"不好"的( ),那麼迭代數值上收斂到 。類似於我們上篇的推理,我們可以證明,如果序列中只有有限多對"不好"的 ,那麼 收斂到同一個值。我們把這個證明交給讀者來完成;
- 我們在上篇中用函數 來表示序列 : 此時我們就要求,對於某正整數 ,對 總有 . 這一不等式所確定的 屬於上半平面的哪些區域呢?細心的讀者或許已經看出來,我們在上篇中已經處理過關於簡化模型的類似問題。我們這裡的問題當然遠比簡化情形中的三角函數要困難得多;
- 依Jacobi和Legendre等人的傳統記法,令 ,必有 [為什麼?]。根據前面關於 函數方程的討論,我們知道 所以我們考慮 在 的基本區域 上的取值就可以了;
- 下圖中我們把兩個基本區域 放在同一張圖裡。
- 根據 的定義,我們知道這個函數在虛軸上總是取非負實數值。如果我們用一下Gauss與AGM(V-2)提到的Jacobi乘積,我們還能進一步斷定,如果 沿著虛軸從 移動到 , 的值從1單調遞減到0[為什麼?]。我們又知道 以及 。因此我們可以斷定:1)當 沿著弧CE從C移動到E,那麼 單調從 變到正無窮;2)當 沿著射線 從E移動到無窮遠處,那麼 單調從正無窮降到1。根據這兩個觀察以及幅角原理,我們就可以確定如下事實[區域D的邊界要稍加註意。邊界上兩點如果在 作用下等價,那我們把它們算作同一點],這一事實是Picard小定理的某個證明的關鍵要素:************************************************************************************* 將 的基本區域 一對一地映射到去掉兩點的右半平面 。 *************************************************************************************[註:Gauss本質上知道我們這裡關於 的一切結論[見Gauss全集第三卷477-478頁],只是寫法稍有不同。Gauss在手稿中是這樣描繪 的基本區域的: 。Schering就是在整理Gauss這部分遺稿時出了錯。Gauss還給出了 的基本區域的一個子域 ,這一區域在 映射下的像是去掉三個點的單位圓盤。有興趣的讀者可以嘗試繪製一下 的形狀。]
- 我們只有武裝到這個地步才能解決Gauss的問題。設序列 的初值為 , 位於 的基本區域 中。我們在上篇中已經提過,每一次迭代等價於 的值取0或1。如果 的所有值都取0,那麼序列 收斂到 ,而且每一對 都是"好的"。Gauss稱這個值 為初值 的最簡[算術幾何]平均值(einfachst Mittel )。
- 上面的遞推式直接的推論是 其中 。假設從某個標號 起 。那麼我們總能找到某個矩陣 ,使得 位於 的基本區域當中[為什麼?]。我們記 , 那麼根據我們前面關於最簡算術幾何平均值的推理,序列 收斂到 [為什麼?]。
- 和 的關係是什麼?根據 在 的變換下滿足的規律,我們可以寫出 換言之,迭代中生成的所有非平凡的平均值都可以表示為 , 其中 。兩者是互質的整數而且 。
- 反過來我們要問,是不是所有形如 的複數都是迭代的極限值?答案是肯定的。我們在此給出一個序列 的構造,這個構造可以保證迭代收斂到給定的 :
- 構造的關鍵在於找到合適的矩陣 ,使得 在對應的分式線性變換作用下虛部總是足夠大的。此時我們可以把 重寫為 其中 。如果我們能夠選取合適的 ,使得 恆等於 ,那麼我們的任務就基本完成了,因為此時的 [為什麼?]此時序列的極限必然是 。注意到 恆等於 ,所以我們可以給出遞推關係 。由於 是奇數, 各項都是4的倍數,我們很容易藉此確定 各項的值:它與 的奇偶性是一致的。這樣我們就完成了必要的構造。
- 我們重新敘述一下我們得到的結果: *************************************************************************************我們令初值 , 並且令 , 位於 的基本區域 當中。那麼複數域上的AGM迭代總能收斂到一個固定的極限值,這個極限值有且只有兩類可能性:1)0,絕大多數的迭代過程只能收斂到這個值;2) 。 ************************************************************************************
- 就Gauss現存的手稿來看,他最接近這個命題的記錄出現在Gauss全集第十卷第一冊219頁(Schlesinger給它的斷代是1810年)。他的命題可以這樣描述:取AGM迭代的初值 為正實數。迭代中我們直到第N次迭代之前都取 的正實數值。第N次迭代我們取 小於0的值。之後所有的迭代如果我們都取"好的」複數對 ,那麼迭代收斂到一個複數值 。我們記初值為 的最簡平均值為 ,初值為 的最簡平均值為 , Gauss斷言, 必然滿足如下形式: Gauss的命題當然只是我們上面命題的一個非常特殊的情形。至於他心中是否已經有我們本篇證明的最深刻的問題的答案,我們是完全無法回答的。
- 從Gauss手稿的日期看,他總是會間斷性地回到過去提出的問題,補充和完善以前提出的問題和推理。直到1827年Gauss還在不斷地修訂自己關於橢圓函數的工作(例如上面給出的 的基本域就屬於這一時期的記錄)。然而Gauss知道Abel和Jacobi的工作以後似乎就放棄了自己已有的計劃。Gauss因此與橢圓函數論的歷史主流無緣。推動歷史的工作,就壓在了年輕一代人的肩上。
思考題:Gauss的橢圓函數理論要用到兩個實數之間的算術幾何平均值(見Gauss與AGM(V-2))。但根據我們本篇的論述,如果初值是固定的,在複數域上我們會得到無窮多個算術幾何平均值。採取不同的算術幾何平均值對Gauss定義的橢圓函數 是否有影響?
推薦閱讀:
※計算幾何第三周:三角剖分
※隨筆一則
※自然生活的數學原理
※Penn Geometry Festival
※從外微分到微分幾何(一)