數學中的幾個概率啟發式「證明」

在數學研究過程中,當人們對一個猜想(多數是數論里的)正面強攻無效時常常從概率的角度對該猜想正確與否進行定性分析或者推測其核心公式的形式及反例的分布,這樣的想法被UCLA的數學家陶哲軒(Terrence Tao)稱為對該猜想的「概率啟發式理由」(Probabilistic heuristic justification)。這種定性分析往往不構成對猜想的證明,但是可以提高該猜想的可信度或為正式的證明指明方向,下面是幾個這樣的例子:

(以下不區分approx sim 以及=,都是在近似的意義下作的)

1.素數定理:pi (x)為不大於x的素數個數,則pi (n)sim int_{2}^{n} frac{mathrm{d}x}{mathrm{log}x}

分析:首先假設描述素數分布的規律是存在的,即有這樣一個描述素數密度的函數P(n)使得對充分大的正整數npi (n)sim int_{2}^{n}P(x)mathrm{d}x .

下面給出兩個引理(證明留作習題):

引理1.1:對充分大的nmathrm{log}n!sim nmathrm{log}n

引理1.2:(Lagrange)記[n]_{p} =k,當且僅當p^{k} ||n ,即knp的冪次,則left[ n! right]_{p} = sum_{k=1}^{infty }{[frac{n}{p^{k} }] } .

由引理2得:[n!]_{p}approx sum_{k=1}^{infty }{frac{n}{p^{k} } }=frac{n}{p-1} (這當然是個近似的式子)

n很大時 ,對所有小於n的素數p對上式求和有:mathrm{log}n!sim sum_{p<n}^{}{frac{n}{p-1}mathrm{log}p} .

再由引理1:nmathrm{log}nsim sum_{p<n}^{}{frac{n}{p-1}mathrm{log}p} ,即mathrm{log}nsim sum_{p<n}^{}{frac{mathrm{log}p}{p-1} } (1)

在前面我們假設素數的密度分布符合P(x) ,選取點2=xi _{1},xi _{2} ,cdot cdot cdot , xi _{r},xi _{r+1}=n ,則第j個區間[xi _{j},xi _{j+1} ] 中的素數個數大約為P(xi_{j})(xi_{j+1}-xi_{j})= P(xi_{j})Delta xi _{j} ,因此(1)式右端近似等於sum_{j=1}^{r+1}{frac{mathrm{log}xi _{j} }{xi _{j}-1 }P( xi _{j})Deltaxi _{j} } ,我們用它所逼近的積分來代替這個和並用x代替n

mathrm{log}xsim int_{2}^{x}frac{mathrm{log}xi }{xi -1}P(xi )mathrm{d}xi . 兩邊微分得:frac{1}{x}approx frac{mathrm{log}x}{x-1}P(x) .

於是我們得到:P(x)approx frac{x-1}{xmathrm{log}x} approx frac{1}{mathrm{log}x} ,故pi (n)sim int_{2}^{n}frac{mathrm{d}x}{mathrm{log}x}.

(嚴格來講並沒有用到太多概率的想法……)

我們還有另外一個概率味道比較濃的推理,回顧一下歷史:Gauss通過「大數據」歸納出到x的素數密度大致為frac{1}{mathrm{log}x} ,由此Gauss推測應當pi(x)sim lim_{varepsilon rightarrow 0}({ int_{0}^{1-varepsilon } +int_{1+varepsilon }^{x})frac{mathrm{d}t}{mathrm{log}t} } .上個世紀30年代,概率論大師H.Cramer給出了Gauss猜想的概率解釋,這個概率模型現在被稱作Gauss-Cramer隨機素數模型:

定義如下數列left{ X_n right}_{ngeq 3 }X_n=1,當且僅當n是素數;否則X_n=0.

left{ X_n right} 寫下來就是(從3開始):1,0,1,0,1,0,0,0,1,0,cdot cdot cdot

Cramer假設這個序列有典型的01序列的性質,根據高斯的觀察,Cramer假設:對充分大的nX_nfrac{1}{mathrm{log}n} 的概率取1,有1-frac{1}{mathrm{log}n}的概率取0;並定義一個關於此序列分布的命題為真,當且僅當它以概率1為真.

記事件Aleft{ X_n right} _{ngeq 3}的前x項有int_{2}^{x}frac{mathrm{d}t}{mathrm{log}t}1,利用中心極限定理,Cramer得到lim_{n rightarrow infty }{P(A)}=1 .因此,我們有充分的理由猜測pi (x)sim int_{2}^{x}frac{mathrm{d}t}{mathrm{log}t} .

2.費馬大定理:方程x^{n}+y^{n}=z^{n} ngeq 3無正整數解.

分析:這個是徹頭徹尾的概率計算,來自物理學家R.Feynman.

N是充分大的整數,則sqrt[n]{N}sqrt[n]{N+1} 的間距d=sqrt[n]{N+1}-sqrt[n]{N} =sqrt[n]{N}(sqrt[n]{1+frac{1}{N} }-1) .

因為frac{1}{N} 足夠小,故dsim sqrt[n]{N}(1+frac{1}{nN}-1)=frac{sqrt[n]{N} }{nN}

則在區間[sqrt[n]{N},sqrt[n]{N+1}] 中至少有一個整數的概率為frac{d}{1}sim frac{sqrt[n]{N} }{nN }.

對費馬大定理x^{n}+y^{n}=z^{n} 而言,令N=x^{n}+y^{n} ,則N為完全n次方的概率為frac{sqrt[n]{x^{n}+y^{n}} }{n(x^{n}+y^{n})}

當然,這個概率是對於給定的x,y而言的,若要對任意的x,y>2 計算概率則應對其求和,跟前面一樣我們用積分來代替求和得到概率:p_{n} =int_{2}^{infty } int_{2}^{infty }frac{1}{n}(x^{n}+y^{n})^{frac{1}{n}-1}mathrm{d}xmathrm{d}y .

a_{n}=int_{0}^{infty } int_{0}^{infty }(x^{n}+y^{n})^{frac{1}{n}-1 } mathrm{d}xmathrm{d}y ,則p=frac{1}{n2^{n-3}}a_{n} .

再令u=frac{x}{2} v=frac{y}{2} ,則a_{n} =int_{1}^{infty } int_{1}^{infty }frac{1}{n2^{n-1}} (u^{n}+v^{n})^{frac{1}{n}-1 }left| frac{partial (x,y)}{partial(u,v)} right| mathrm{d}umathrm{d}v

這裡left| frac{partial(x,y)}{partial(u,v)} right| =frac{partial x}{partial u} frac{partial y}{partial v} -frac{partial x}{partial v} frac{partial y}{partial u} =4是Jacobi行列式.

a_{n} =int_{1}^{infty } int_{1}^{infty }frac{1}{n2^{n-3}} (u^{n}+v^{n})^{frac{1}{n}-1 } mathrm{d}umathrm{d}v

注意到對充分大的na_{n} sim frac{2mathrm{log}2}{n^{2} } (留作習題……嘻嘻)

所以對給定的np_{n}sim frac{2mathrm{log}2}{n^{3}2^{n-3} } . 從這裡看出:n越大,Fermat方程有解的概率越小.這是符合直覺的.

故對所有的n>n_{0} ,Fermat方程有解的概率:p=int_{n_0}^{infty } frac{2mathrm{log}2}{n^32^{n-3}}mathrm{d}n .

在Feynman時代,人們已經知道當nleq 100時,Fermat方程無解.所以令n_0=100,Feynman給出的概率 p= int_{100}^{infty }frac{2mathrm{log}2}{n^{3}2^{n-3} } mathrm{d}n=1.2104923times 10^{-35} .可以看到這個概率是極其小的,於是Feynman斷言:「依我看,費馬大定理是成立的。」當然,這是很不正式,但說服物理學家足夠了。(捂臉)

另外,不同於Feynman的推理,Erdos和Ulam於1971年給出了一個更具說服力的概率啟發式推理。他們實際上是對一個更強的命題的推測:對u,v,wgeq 4,方程x^{u}+y^{v}=z^{w} 至多有有限對互素解(x,y,z). 容易看到這其實是費馬大定理某種形式上的推廣(這個命題跟著名的Fermat-Catalan猜想不無淵源),Erdos和Ulam給出的推導也是極具啟發性的.

ngeq 4,定義集合S_n為所有n次冪的集合,令mathbb{S}=S_4cup S_5 cup cdot cdot cdot .我們要計算的概率是如果a,bin mathbb{S},那麼a+b也在mathbb{S}中的可能性.我們用一個隨機過程來生成 mathbb{S}:假設每個正整數n都是獨立的,因為[1,n]中大約有n^{frac{1}{4}}數量級個4次冪或更高次冪數,所以隨機抽取數n,它在mathbb{S}中的概率與n^{-frac{3}{4}}成正比.

因此數n=a+b,其中a,bin mathbb{S}的概率應該正比於sum_{1leq a<frac{n}{2} }^{}{a^{-frac{3}{4}} } {(n-a)^{-frac{3}{4}} }.然後我們對其進行小小的放縮: sum_{1leq a<frac{n}{2} }^{}{a^{-frac{3}{4}} } {(n-a)^{-frac{3}{4}} }<n^{-frac{3}{4}} sum_{1leq a<frac{n}{2} }^{}{a^{-frac{3}{4}} }

對於充分大的n,容易證明上式左邊是正比於frac{1}{sqrt{n} } .現在考慮到n本身也在mathbb{S}中,所以總的概率應該正比於frac{1}{sqrt{n} }times n^{-frac{3}{4}}=n^{-frac{5}{4}} .於是這種情況最多能發生的次數是正比於sum_{n}{n^{-frac{5}{4} }} 的,顯然這是個收斂的級數,因此我們對x^{u}+y^{v}=z^{w} 能發生的次數的期望也是有限的,故推測x^{u}+y^{v}=z^{w} 只有有限組互素解是合理的.

3.強孿生素數猜想:pi _{2}(x) 為不小於x的孿生素數個數,則pi _{2}(x) sim 2C_{2}int_{2}^{x} frac{mathrm{d}t}{mathrm{log}^{2}t } .這裡C_{2}=prod_{pgeq 3}frac{p(p-2)}{(p-1)^2}=0.660161181584cdot cdot cdot .

分析:隨機抽取數對(m,n),則m,n不被素數p整除的概率顯然為frac{(p-1)^2}{p^2} ,而對隨機選取的正整數nnn+2同時不被素數p>2整除的概率為frac{p-2}{p} (對p=2,概率為frac{1}{2}

因此n,n+2p>2不為0的概率與隨機數對(m,n)的相差了因子frac{p-2}{p} frac{p^2}{(p-1)^2} =frac{p(p-2)}{(p-1)^2} .將所有這樣的因子乘起來,我們就得到了 nn+2同時是素數的概率的調整因子

C_{2}=prod_{pgeq 3}frac{p(p-2)}{(p-1)^2}=0.660161181584cdot cdot cdot .

由素數定理我們知道,對充分大的xx附近的素數密度大約為frac{1}{mathrm{log}x} .因此兩個素數分布在寬為2的區間里的概率大致為frac{2}{mathrm{log}^2x} ,這幾乎就是強孿生素數猜想的被積函數.於是大致我們得到:存在常數C,使pi _{2}(x) sim 2Cint_{2}^{x} frac{mathrm{d}t}{mathrm{log}^{2}t } .容易發現C(如果有的話)就是前面的調整因子C_2,故應該有pi _{2}(x) sim 2C_{2}int_{2}^{x} frac{mathrm{d}t}{mathrm{log}^{2}t } .這便是強孿生素數猜想了.

下面是重頭戲,在此之前先把一個重要的概念說了以防後面拖泥帶水的:

對整數n=p_{1}^{alpha _1} p_{2}^{alpha _2} cdot cdot cdot p_{k}^{alpha _k} ,其中p_{i} 都是素數.定義其根基(radical)為 mathrm{rad}(n)=p_{1}p_{2} cdot cdot cdot p_k,即n的非平方部分.

好啦,解釋完了……

4.ABC猜想: 對互素的兩正整數a,bc=a+b,對任意的epsilon >0存在C_{epsilon }使c<C_{varepsilon }mathrm{rad}^{1+varepsilon }(abc).

分析:這可以說是當世最重要的猜想之一,其重要性除了Riemann猜想堪與比肩外,任何其他猜想恐怕都得退居其後。

By the way,ABC猜想還有一個等價的說法就是,滿足 cgeqmathrm{rad}^{1+varepsilon }(abc)的解只有有限多組.(這從根本上說明ABC猜想即使不對也壓根不能用數值檢驗的方法來否證)這裡我們用的是另一個等價的說法:對於滿足alpha +beta +gamma <1的正實數alpha ,beta ,gamma 和充分大的整數N,不存在使得a+b=c(Nleq cleq 2N)mathrm{rad}(a)leq N^alpha mathrm{rad}(b)leq N^beta mathrm{rad}(c)leq N^gamma 的互素整數組(a,b,c).

我們採取以下步驟來尋找ABC猜想的反例.(來自陶哲軒大神)

Step1 找一個很大很大的整數N(比如某個2的冪);

Step2 找三個互素的且均無平方因子的整數xleq N^alpha yleq N^beta zleq N^gamma

Step3a,b,c=O(N)mathrm{rad}(a)=x,mathrm{rad}(b)=y,mathrm{rad}(c)=zc要跟N差不多大;

Step4 驗證一下是否a+b=c .

Step1,2,4比較容易做到,Step3基於以下引理:

引理4.1:設xleq N是一無平方因子數,則至多有O(N^{o(1)}) 個小於N的整數n使得 mathrm{rad}(n)=x.

簡單給一個證明:若x=p_1p_2cdot cdot cdot p_k,定義A為小於N且根基是x的整數的個數.我們期望A=O(N^{o(1)}) ,令S=left{ p_{1}^{alpha _1} p_{2}^{alpha _2} cdot cdot cdot p_{k}^{alpha _k} |alpha _1,alpha _2,cdot cdot cdot ,alpha _kgeq 1 right} .對於varepsilon >0,考慮級數sum_{nin S}^{}{} frac{1}{n^varepsilon } .

一方面,這個級數的和至少是N^{-varepsilon }A;另一方面, sum_{nin S}^{}{} frac{1}{n^varepsilon } =prod_{j=1}^{k}(frac{1}{p_{j}^{varepsilon } }+ frac{1}{p_{j}^{2varepsilon } }+cdot cdot cdot ) .取滿足對1leq jleq k均有frac{1}{p_{j}^{varepsilon } }+ frac{1}{p_{j}^{2varepsilon } }+cdot cdot cdotleq C_varepsilon 的一實數 C_varepsilon ,則sum_{nin S}^{}{} frac{1}{n^varepsilon } =prod_{j=1}^{k}(frac{1}{p_{j}^{varepsilon } }+ frac{1}{p_{j}^{2varepsilon } }+cdot cdot cdot ) leq C_{varepsilon }^{k} .

於是Aleq N^varepsilon C_{varepsilon }^{k} ,而我們有sum_{j=1}^{k}{mathrm{log}p_j}=mathrm{log}xleq mathrm{log}N .根據素數定理我們可以得到k=o(mathrm{log}N),於是Aleq N^{varepsilon+o(1)},此即所證.

現在,考慮Step1選出的大整數N和Step2選出的滿足O(N^{alpha +beta +gamma })x,y,z.對於每一個x,y,z,能選擇的O(N)量級的a,b,c至多有O(N^{o(1)}) 組.假設c,a+b是相互獨立的,它們隨機分布在一組大小是O(N)的數里,則c=a+b的概率的階差不多是frac{1}{N} .所以對所有充分大的N求和得到所有概率的和為sum_{N}{O(N^{alpha +beta +gamma -1+o(1)})} .

因為alpha +beta +gamma <1,故上面這個和是收斂的,從而最多期望有有限個反例,這是支持ABC猜想的.

推薦閱讀:

Incommensurable Possibilities of Mathematics
似是而非的答案:概率論悖論 | 張天蓉專欄(二)
Gossip
泛函分析觀點下的隨機積分 (完):隨機控制收斂與It?公式
圓環內隨機遊走 遍歷所有節點需要的步數的期望?

TAG:数学 | 概率论 | 数论 |