標籤:

Gauss與AGM(VI-2)

[題圖來自Gauss1805年的筆記Scheda An (見Gauss全集第十卷第二冊,102頁-103頁),筆記的題名為Cereri, Palladi, Junoni sacrum。根據Gauss日記的記載[Gauss日記122條],Gauss在1802年-1804年一直忙於天文觀測及其相關計算,直到1805年Gauss才返回到純粹數學的研究上來。這一張圖來自Scheda An 的第7頁。在Scheda An 的第8頁上有Gauss寫下的模形式 p(	au) 滿足的若干函數方程。根據這些記載以及Gauss日記的記錄,Gauss全集第十卷的編輯Schlesinger斷定,Gauss在1800年左右就知道下面提及的模形式 p,q,r 的函數方程,而Gauss直到1805年左右才開始著手研究與 p,q,r 相關的同餘子群的基本區域Scheda An 上的這張圖正是這些基本區域的示意圖。這一非常重要的概念從未落到Abel和Jacobi的手中,直到Riemann把它"發展為自己理論中受到鍾愛的工具"(見Klein《數學在19世紀的發展》第一卷,齊民友譯,38頁)。Gauss的基本區域與我們通用的記法不同之處在於,他的基本區域是我們通用的基本區域順時針旋轉90度以後得到的圖形。在下文中我們一概採用現代記法而不採用Gauss的記法。]

前情提要:Gauss所發現的函數

egin{align}p(	au)&=sum_{ninmathbb{Z}}e^{pi in^2	au}\q(	au)&=sum_{ninmathbb{Z}}(-1)^ne^{pi in^2	au}\r(	au)&=sum_{ninmathbb{Z}}e^{pi i(n+1/2)^2	au}end{align}

都是上半複平面 Im{	au}>0 上的解析函數,而且它們都滿足某些對稱性,這些對稱性可以由函數方程刻畫,例如

p^2(frac{	au}{2	au+1})=(2	au+1)p^2(	au)

那麼我們應當如何刻畫 p,q,r 的所有可能的對稱性[換言之,這些函數在何種變換群下保持不變]?這些對稱性與複數AGM的迭代過程有什麼關係?這是我們本篇集中探討的內容。


1861年Gauss的學生兼密友Johann Franz Encke曾經提及過他與Gauss的幾次私人談話,在談話中Gauss強調,數學乃是「視覺的科學」(eine Wissenschaft für das Auge )[原文見Kronecker全集第五卷,391頁]。遵循Gauss這個觀點,我們就必須引入複平面這個幾何工具,它對於我們理解 p,q,r 及其背後的模形式大家族有著至關重要的作用。

Ex. 函數 p^2(	au) 滿足以下函數方程:

p^2(	au+2)=p^2(	au)\ p^2(frac{	au}{2	au+1})=(2	au+1)p^2(	au)

它們刻畫的正是 p^2(	au) 在線性分式變換 	aumapsto	au+2 以及 	aumapstofrac{	au}{2	au+1} 作用下所滿足的"對稱性"。我們對這些變換進行複合,就可以導出更多的函數方程。那麼這些函數方程的具體形式是什麼?

我們知道,線性分式變換中的"線性"二字來自於以下事實:兩個線性分式變換的複合等價於兩個 2	imes2 非奇異矩陣的複合。因此,線性分式變換 	aumapsto	au+2	aumapstofrac{	au}{2	au+1}[及其逆]的所有複合等價於 egin{pmatrix}1 & 2\0 & 1end{pmatrix}egin{pmatrix}1 & 0\2 & 1end{pmatrix} 生成的群。這意味著,這些線性變換的複合都是下面的線性分式變換群的元素[這就是著名的modular group Gamma(1) ]:

	aumapstofrac{a	au+b}{c	au+d},a,b,c,dinmathbb{Z},ad-bc=1

進一步觀察我們可以看出,除了要求 ad-bc=1 以外,我們其實還得要求 b,c 均為偶數。所有滿足 ad-bc=1 , b,c 均為偶數的整數矩陣 egin{pmatrix}a & b\c & dend{pmatrix} 在矩陣乘法下也構成一個群,我們稱之為層次2的主同餘子群(principal congruence subgroup of level 2,這是源自Klein的術語,通用記號為 Gamma(2) )。

一個自然的問題是:egin{pmatrix}1 & 2\0 & 1end{pmatrix}egin{pmatrix}1 & 0\2 & 1end{pmatrix} 生成的群與 Gamma(2) 之間的關係是什麼?我們可以用代數方法[輾轉相除法]和幾何方法兩種方法來解決這個問題。兩種方法中幾何方法涵蓋了更多的信息,所以我們把代數方法放在一邊,把注意力集中在這個問題的幾何方法上。

線性分式變換群

	aumapstofrac{a	au+b}{c	au+d},a,b,c,dinmathbb{Z},ad-bc=1

最自然的作用對象是上半平面 Im	au>0 。上半平面的任意一點在這個群的作用下都有無窮多個像點,如下圖所示:

離散線性分式變換群在上半平面的作用[TSUBASA!]

空心圈點是上半平面的點 i 在這個群作用下的像。直觀看來,這些像點是越來越接近實軸的。換言之,在群的作用下,上半平面上的點 	au 的虛部趨於0。這一點很容易用代數計算來證實。通過計算我們可以得到 Imfrac{a	au+b}{c	au+d}=frac{(ad-bc)Im	au}{vert c	au+dvert^2}=frac{Im	au}{vert c	au+dvert^2}c,d 是離散的整數,當 c,d 中的一者趨於無窮,那麼 Imfrac{a	au+b}{c	au+d} 的值必然趨於0。這一觀察還帶來一個結論,那就是對於給定的 	au , Imfrac{a	au+b}{c	au+d} 存在最大值。

上面的推理一樣適用於egin{pmatrix}1 & 2\0 & 1end{pmatrix}egin{pmatrix}1 & 0\2 & 1end{pmatrix} 生成的群與 Gamma(2) 。我們記前者為 G ,那麼上半平面上總存在點 	au ,它的虛部不小於它在 G 作用下的所有像點的虛部。據此我們可以得知,

frac{Im	au}{vert pm2	au+1vert^2}leqIm	au ,也就是 vertpm2	au+1vert^2geq1 。由於 egin{pmatrix}1 & 2\0 & 1end{pmatrix} 作用並不改變 	au 的虛部,因此我們可以把 	au 的實部限制在 -11 之間[為什麼?]。因此,我們就得到了以下的上半平面的區域 D:Im	au>0,vertpm2	au+1vertgeq1,-1leqRe	auleq1 的圖像:

Gamma(2)的基本區域D(與模形式p關聯)

[註:Gauss在1827年的筆記中(見Gauss全集第三卷,477-478頁)明確地給出了這個基本區域的圖形,然而Gauss全集的第一任編輯Schering完全沒理解Gauss的意思,把這個圖畫錯了。直到1898年Klein負責主持Gauss全集的編輯工作以後,這個錯誤才由Robert Fricke更正過來(見Gauss全集第八卷,105頁)。]

我們可以根據這一觀察來導出 Gamma(2) 與群 G 之間的關係。根據上面的推理,我們如果取區域中 D 的點 	au ,並任意取 gammainGamma(2) ,那麼我們總能在 G 中找到元素 g ,使得 ggamma	au 也屬於這一區域。我們取 D 中的點 i ,並且記 ggamma=egin{pmatrix}u & v\x & yend{pmatrix} ,我們就會得到限制 vert vy+uxvertleq u^2+v^2\ vert vy+uxvertleq x^2+y^2\ uy-vx=1,u,v,x,yinmathbb{Z},v,x,mathrm{are,even,numbers}

這些約束條件給出的唯一可能就是 ggamma=pm I , I 是單位矩陣[為什麼?],因此我們已經導出,線性分式變換 	aumapsto	au+2	aumapstofrac{	au}{2	au+1}是線性分式變換群 	aumapstofrac{a	au+b}{c	au+d},egin{pmatrix}a & b\c & dend{pmatrix}inGamma(2)

生成元。

上面的推理奠定了我們本篇內容的基石。這一推理可以產生以下的推論:

  • 任意給定上半平面 Im	au>0 中的一點 	au ,我們總可以找到 gammainGamma(2) ,使得 gamma	au 落在我們指定的區域 D 內。這一區域 D 我們稱之為 Gamma(2) 的基本區域(Fundamental Domain, Fundamentalbereich);
  • egin{pmatrix}1 & 2\0 & 1end{pmatrix}egin{pmatrix}1 & 0\2 & 1end{pmatrix} 生成的群並不是 Gamma(2) ,而是它的一個指數為2的子群,這個子群同構於 Gamma(2)/{pm I} ,或者可以說,它的元素是 Gamma(2) 中滿足 aequiv dequiv1pmod 4 的矩陣 egin{pmatrix}a & b\c & dend{pmatrix} 。我們記這個群為 Gamma(2)_0 。通過歸納法可以證明,給定 egin{pmatrix}a & b\c & dend{pmatrix}inGamma(2)_0 ,我們有 p^2(frac{a	au+b}{c	au+d})=(c	au+d)p^2(	au) 這是我們在這一系列中真正展示的第一個模形式
  • 注意到 p^2(	au+1)=q^2(	au) ,藉此我們可以得到[為什麼?]:給定 egin{pmatrix}a & b\c & dend{pmatrix}inGamma(2)_0 ,有 q^2(frac{a	au+b}{c	au+d})=(-1)^{c/2}(c	au+d)q^2(	au) 這是所謂的帶有乘子(multiplier)的模形式。從這裡我們可以看出,如果 egin{pmatrix}a & b\c & dend{pmatrix}inGamma(2)_0cequiv0pmod4 ,那麼我們有 q^2(frac{a	au+b}{c	au+d})=(c	au+d)q^2(	au) 。所有這樣的矩陣依然構成一個群,我們稱之為 Gamma_2(4) 。這個群的基本區域完全可以用與 Gamma(2) 一致的方法導出。具體可以寫為 D^prime:Im	au>0,vertpm4	au+1vertgeq1,vertpm4	au+3vertgeq1,-1leqRe	auleq1

Gamma_2(4)的基本域(與模形式q關聯)

[請讀者思考: r^2(	au)Gamma(2) 作用下滿足什麼樣的函數方程? p,q,r 在我們提到的各種群(尤其是modular group Gamma(1) )的作用下又是如何變化的?(Gauss當然知道這些問題的答案[參見Gauss全集第十卷第一冊,224頁])]

我們不清楚Gauss的推理過程是否與我們的推理重合。儘管我們不知道Gauss具體的推理過程,但已有的材料傾向於表明:Gauss知道上面我們寫下的所有結論,絕大多數思想成型的時間不會晚於1827年,最基本的思想更是早在1800年或1805年就已經成型,可惜的是他始終沒有把自己的思想寫成文章,我們所看到的只是思想的斷片而已。


經過漫長的鋪墊以後,我們才能嘗試去解決Gauss的問題:

******************************************************************************************

問題:給定迭代的初值 a_0=a,b_0=b,a,bin mathbb{C} [我們捨去 ab=0a^2=b^2 的平凡情形]。迭代過程由

egin{cases}a_{n+1}=(a_n+b_n)/2\b_{n+1}=sqrt{a_nb_n}end{cases}

確定。由於複數域上的分數次冪是多值函數,因此一般每次迭代會產生兩個不同的 b_{n+1} 的值。我們想要知道,這一迭代過程所有可能的極限值是什麼。

******************************************************************************************

我們仍然可以從上一篇的toy model的分析過程中獲取靈感。上一篇中對於toy model中的絕大多數分析都可以直接用到Gauss的問題上去。

  • 我們仍然規定"好的"複數對 (a_n,b_n) 滿足 |a_n-b_n|leq|a_n+b_n| 。如果定義 M_n=max(|a_n|,|b_n|) ,那麼 M_n 依然是單調遞減的,從而存在極限;
  • 如果 (a_n,b_n) 是"不好"的,那麼我們有 M_{n+2}leq cM_n 對某個嚴格小於1的正實數 c 成立。因此如果迭代中有無限多對 (a_n,b_n) 是"不好"的,那麼迭代的極限必然是0。[其實我們可以定 c=0.86 ,請讀者推理一下,這個值是怎麼來的?];
  • 序列中只有有限多對"不好"的 (a_n,b_n) 的情形是我們需要重點考察的對象。Gauss早在1810年左右就計算過這樣的序列[見Gauss全集第十卷第一冊,219頁],他的計算顯示,取初值 a_0=3,b_0=1 ,如果只有第一次迭代是"不好"的( a_1=2,b_1=-sqrt{3} ),那麼迭代數值上收斂到 0.2469962+0.6318686i 。類似於我們上篇的推理,我們可以證明,如果序列中只有有限多對"不好"的 (a_n,b_n) ,那麼 {a_n},{b_n} 收斂到同一個值。我們把這個證明交給讀者來完成;
  • 我們在上篇中用函數 p,q 來表示序列 {a_n},{b_n}a_n=lambda_n p^2(	au_n)\b_n=lambda_n q^2(	au_n) 此時我們就要求,對於某正整數 N ,對 ngeq N 總有 Re{frac{q^2(	au_n)}{p^2(	au_n)}}geq 0 . 這一不等式所確定的 	au_n 屬於上半平面的哪些區域呢?細心的讀者或許已經看出來,我們在上篇中已經處理過關於簡化模型的類似問題。我們這裡的問題當然遠比簡化情形中的三角函數要困難得多;
  • 依Jacobi和Legendre等人的傳統記法,令 k^prime(	au)=frac{q^2(	au)}{p^2(	au)},k(	au)=frac{r^2(	au)}{p^2(	au)} ,必有 (k^prime(	au))^2+(k(	au))^2=1 [為什麼?]。根據前面關於 p,q 函數方程的討論,我們知道 k^primeleft(frac{a	au+b}{c	au+d}
ight)=(-1)^{c/2}k^prime(	au),egin{pmatrix}a & b\c & dend{pmatrix}inGamma(2) 所以我們考慮 k^prime(	au)Gamma_2(4) 的基本區域 D^prime 上的取值就可以了;
  • 下圖中我們把兩個基本區域 D,D^prime 放在同一張圖裡。

橢圓模函數與同餘子群的基本區域,圖中的標號表示橢圓模函數k把這一部分區域映射到複平面上像點所處象限的標號。圖中各圓與實軸的交點從左至右分別記為A,B,C,D,E。

  • 根據 k^prime(	au) 的定義,我們知道這個函數在虛軸上總是取非負實數值。如果我們用一下Gauss與AGM(V-2)提到的Jacobi乘積,我們還能進一步斷定,如果 	au 沿著虛軸從 iinfty 移動到 0k^prime(	au) 的值從1單調遞減到0[為什麼?]。我們又知道 k^{prime}(	au+1)=frac{1}{k^{prime}(	au)} 以及 k^{prime}left(frac{	au}{	au+1}
ight)=-ifrac{k^{prime}(	au)}{k(	au)} 。因此我們可以斷定:1)當 	au 沿著弧CE從C移動到E,那麼 ik^prime(	au) 單調從 0 變到正無窮;2)當 	au 沿著射線 Re	au=1,Im	au>0 從E移動到無窮遠處,那麼 k^prime(	au) 單調從正無窮降到1。根據這兩個觀察以及幅角原理,我們就可以確定如下事實[區域D的邊界要稍加註意。邊界上兩點如果在 Gamma_2(4) 作用下等價,那我們把它們算作同一點],這一事實是Picard小定理的某個證明的關鍵要素:************************************************************************************* k^prime(	au)Gamma(2) 的基本區域 D 一對一地映射到去掉兩點的右半平面Re	augeq0,	au
eq 0,1*************************************************************************************[註:Gauss本質上知道我們這裡關於 k^prime(	au) 的一切結論[見Gauss全集第三卷477-478頁],只是寫法稍有不同。Gauss在手稿中是這樣描繪 Gamma(2) 的基本區域的:D:Im	au>0,-1leqRe	auleq1,-1leqRe(-1/	au)leq1 。Schering就是在整理Gauss這部分遺稿時出了錯。Gauss還給出了 Gamma_2(4) 的基本區域的一個子域 D^{primeprime} ,這一區域在 k^prime(	au) 映射下的像是去掉三個點的單位圓盤。有興趣的讀者可以嘗試繪製一下 D^{primeprime} 的形狀。]
  • 我們只有武裝到這個地步才能解決Gauss的問題。設序列 {a_n},{b_n} 的初值為 a_0=lambda_0p^2(	au_0),b_0=lambda_0q^2(	au_0) , 	au_0 位於 Gamma_2(4) 的基本區域 D^prime 中。我們在上篇中已經提過,每一次迭代等價於 lambda_{n+1}=frac{lambda_n}{4	au_ns_n+1}\ 	au_{n+1}=frac{2	au_n}{4	au_ns_n+1} s_n 的值取0或1。如果 {s_n} 的所有值都取0,那麼序列 {a_n},{b_n} 收斂到 lambda_0 ,而且每一對 (a_n,b_n),ngeq1 都是"好的"。Gauss稱這個值 lambda_0 為初值 a_0,b_0最簡[算術幾何]平均值(einfachst Mittel )。
  • 上面的遞推式直接的推論是 lambda_{n}=frac{lambda_0}{4K_n	au_0+1}\ 	au_{n}=frac{2^n	au_0}{4K_n	au_0+1} 其中 K_n=sum_{i=0}^{n-1}2^is_i 。假設從某個標號 NRefrac{b_n}{a_n}geq 0,ngeq N 。那麼我們總能找到某個矩陣 egin{pmatrix}a & b\c & dend{pmatrix}inGamma_2(4) ,使得 ar{	au}_N=frac{a	au_N+b}{c	au_N+d} 位於 Gamma(2) 的基本區域當中[為什麼?]。我們記 a_N=ar{lambda}_Np^2(ar{	au}_N),b_N=ar{lambda}_Nq^2(ar{	au}_N) , 那麼根據我們前面關於最簡算術幾何平均值的推理,序列 {a_n},{b_n} 收斂到 ar{lambda}_N [為什麼?]。
  • ar{lambda}_Nlambda_0,	au_0 的關係是什麼?根據 p^2(	au),q^2(	au)Gamma_2(4) 的變換下滿足的規律,我們可以寫出 egin{align}ar{lambda}_N&=frac{lambda_N}{c	au_N+d}=frac{lambda_0}{(4dK_N+2^Nc)	au_0+d}end{align} 換言之,迭代中生成的所有非平凡的平均值都可以表示為 frac{lambda_0}{ar{c}	au_0+ar{d}} , 其中 ar{c}=4dK_N+2^Nc,ar{d}=d 。兩者是互質的整數而且 ar{c}equiv0pmod4,ar{d}equiv1pmod4
  • 反過來我們要問,是不是所有形如 frac{lambda_0}{ar{c}	au_0+ar{d}},ar{c}equiv0pmod4,ar{d}equiv1pmod4,(c,d)=1 的複數都是迭代的極限值?答案是肯定的。我們在此給出一個序列 {s_n} 的構造,這個構造可以保證迭代收斂到給定的 frac{lambda_0}{ar{c}	au_0+ar{d}} :
  • 構造的關鍵在於找到合適的矩陣 egin{pmatrix}	ilde{a}_n & 	ilde{b}_n\	ilde{c}_n & ar{d}end{pmatrix}inGamma_2(4) ,使得 	au_n 在對應的分式線性變換作用下虛部總是足夠大的。此時我們可以把 a_n 重寫為 a_n=frac{lambda_0}{C_n	au_0+ar{d}}p^2left(frac{A_n	au_0+B_n}{C_n	au_0+ar{d}}
ight) 其中 A_n=	ilde{a}_n2^n+4	ilde{b}_nK_n,C_n=	ilde{c}_n2^n+4ar{d}K_n 。如果我們能夠選取合適的 	ilde{c}_n,K_n ,使得 C_n 恆等於 ar{c} ,那麼我們的任務就基本完成了,因為此時的 Imleft(frac{A_n	au_0+B_n}{C_n	au_0+ar{d}}
ight)=frac{A_nar{d}-B_nC_n}{|ar{c}	au_0+ar{d}|^2}Im{	au_0}=frac{2^n}{|ar{c}	au_0+ar{d}|^2}Im{	au_0} [為什麼?]此時序列的極限必然是 frac{lambda_0}{ar{c}	au_0+ar{d}} 。注意到 	ilde{c}_n2^n+4ar{d}K_n 恆等於 ar{c} ,所以我們可以給出遞推關係 	ilde{c}_0=ar{c},2	ilde{c}_{n+1}=	ilde{c}_n-4ar{d}s_n 。由於 ar{d} 是奇數, {	ilde{c}_n} 各項都是4的倍數,我們很容易藉此確定 {s_n} 各項的值:它與 	ilde{c}_n/4 的奇偶性是一致的。這樣我們就完成了必要的構造。
  • 我們重新敘述一下我們得到的結果: *************************************************************************************我們令初值 a_0=a,b_0=b , 並且令 a_0=lambda_0p^2(	au_0),b_0=lambda_0q^2(	au_0) , 	au_0 位於 Gamma_2(4) 的基本區域 D^prime 當中。那麼複數域上的AGM迭代總能收斂到一個固定的極限值,這個極限值有且只有兩類可能性:1)0,絕大多數的迭代過程只能收斂到這個值;2) frac{lambda_0}{c	au_0+d},cequiv0pmod4,dequiv1pmod4,(c,d)=1 。 ************************************************************************************
  • 就Gauss現存的手稿來看,他最接近這個命題的記錄出現在Gauss全集第十卷第一冊219頁(Schlesinger給它的斷代是1810年)。他的命題可以這樣描述:取AGM迭代的初值 a_0=a,b_0=b,a>b 為正實數。迭代中我們直到第N次迭代之前都取 a_n,b_n 的正實數值。第N次迭代我們取 b_N 小於0的值。之後所有的迭代如果我們都取"好的」複數對 (a_n,b_n) ,那麼迭代收斂到一個複數值 (mu) 。我們記初值為 a,b 的最簡平均值為 mu ,初值為 a,sqrt{a^2-b^2} 的最簡平均值為 lambda , Gauss斷言, (mu) 必然滿足如下形式: frac{1}{(mu)}=frac{1}{mu}+frac{4ik}{lambda},kinmathbb{Z} Gauss的命題當然只是我們上面命題的一個非常特殊的情形。至於他心中是否已經有我們本篇證明的最深刻的問題的答案,我們是完全無法回答的。
  • 從Gauss手稿的日期看,他總是會間斷性地回到過去提出的問題,補充和完善以前提出的問題和推理。直到1827年Gauss還在不斷地修訂自己關於橢圓函數的工作(例如上面給出的 Gamma(2) 的基本域就屬於這一時期的記錄)。然而Gauss知道Abel和Jacobi的工作以後似乎就放棄了自己已有的計劃。Gauss因此與橢圓函數論的歷史主流無緣。推動歷史的工作,就壓在了年輕一代人的肩上。

思考題:Gauss的橢圓函數理論要用到兩個實數之間的算術幾何平均值(見Gauss與AGM(V-2))。但根據我們本篇的論述,如果初值是固定的,在複數域上我們會得到無窮多個算術幾何平均值。採取不同的算術幾何平均值對Gauss定義的橢圓函數 S(u),T(u),W(u) 是否有影響?


推薦閱讀:

計算幾何第三周:三角剖分
隨筆一則
自然生活的數學原理
Penn Geometry Festival
從外微分到微分幾何(一)

TAG:數學 | 數學史 |