科學松鼠會 ? 素數並不孤獨
數學是科學的女王,數論是數學的女王。
——高斯
數論,是研究數字的一門數學分支。如同大海,它清澈透明而又深不見底。它的基礎概念,自然數、加法、乘法,每個小學生都清楚;但關於自然數的定理,卻可以讓人窮盡一生而不得其解。而這篇文章要介紹的,只是這個廣闊海洋中一個小小的海域。即便如此,我們仍未知道此處海深幾何,儘管最近張益唐的突破性工作,使我們比以往更接近真理,但這遠遠不夠。
儘管筆者才疏學淺,有恐貽笑方家。但如能為讀者勾勒出一點點數學之美,也不枉費一番心思。
素數何時成雙對可以說,素數是數論中最基礎而最重要的概念。如果一個大於二的正整數,除了1和它本身之外,不是任何數的倍數,那麼它就是一個素數。比如說,6不是一個素數,除了1和它本身以外,它還是2和3的倍數;而5則是一個素數。
在古希臘,人們已經有了素數的概念,對素數的研究也略有所得。在歐幾里德的《原本》中,第七、八、九篇講述的是「關於整數及其比值的性質」,實際上也就是數論。在這幾卷中,歐幾里德指出了今天所說的「算術基本定理」:將自然數分解成素數乘積的方法是唯一的。也就是說,如果用乘法的眼光來看自然數,那麼素數就是自然數的最小組成單元。它們不能被分解成更小的數的乘積,而所有自然數都可以分解成它們的乘積。
那麼,我們自然要問:素數作為自然數的組成單元,它們有多少個?
有無限個,歐幾里德不僅回答了這個問題,還給出了一個經典的證明。
不妨反設只有有限個素數,考慮它們的積
這個精巧的證明,是人類探尋素數奧秘的第一步。
2、3、5、7、11、13……最初的幾個素數,要找出來並不困難,但隨著數字增大,如果一個一個數字按照定義去篩選是否素數,工作量會很快變得十分龐大。同為古希臘數學家的埃拉托色尼,給出了一個比較省力的演算法,後人稱之為埃拉托色尼篩法。
首先,列出從2開始的數。然後,將2記在素數列表上,再划去所有2的倍數。根據定義,剩下的最小的數——在這裡是3——必定是素數。將這個數記在素數列表上,再划去所有它的倍數,這樣又會剩下一些數,取其中最小的,如此反覆操作。最後剩下的都是素數。
【埃拉托色尼篩法,圖片出處:維基百科】
當古希臘人用這種方法計算出長長的素數列表時,他們也許也曾驚異於素數分布的秩序缺失。這些自然數的組成單元,在自然數中的排列卻毫無規律,時而靠近,時而疏遠。用類似歐幾里德證明中的構造,我們知道,兩個相鄰素數之間的距離可以要多大有多大。而隨著數目越來越大,相鄰素數之間的距離似乎也越拉越長。
在無限延伸的自然數集中,向無窮的地平線望去,雖然仍有無窮的素數,但它們似乎也愈變孤獨。
這種孤獨甚至是可以度量的。在十八世紀的尾巴,年僅15歲的高斯獨立提出了一個猜想:在n附近素數的密度大約是n的對數。也就是說,相鄰素數之間的平均距離大概與它們的對數成正比,雖然增長很慢,但卻義無反顧奔向無窮。但即使是高斯,也無法嚴格地證明他的猜想,要等兩個世紀後的阿達瑪(J. Hadamard)和德拉瓦萊普森(C. J. de la Vallée-Poussin),才能將這個猜想變成現在的「素數定理」。
雖然如此,偶爾也會有成對出現的素數,它們之間只相差2。像這樣成對出現的素數,在那些孤獨的同伴看來,無疑是異類。
它們被稱為孿生素數。
漫天星河難理清一個自然的問題是,孿生素數有多少?
孿生素數猜想斷言,有無限對這樣的孿生素數。但還沒有人能嚴格地證明這一點。在1849年,數學家A. de Polignac甚至猜想,對於任意的偶數
這不是一個容易的問題。素數是乘法的產物,而孿生素數的定義則涉及到加法。即使只是加上2,也需要同時用到自然數的加法和乘法的性質。而在數論中的很多看似簡單但無比困難的問題,比如哥德巴赫猜想和華林問題,核心也在於加法和乘法的交織。這種相互作用給數論學者們帶來了無窮的頭痛,以及對咖啡的無盡渴求。
與此同時,行外人的評價卻似乎異常中肯:「為什麼素數要相加呢?素數是用來相乘而不是相加的」。
當然,如果只將素數用在只與乘法有關的問題上,事情當然簡單得多。但如果我們想要更多地了解自然數的玄機,那必然涉及到加法和乘法的相互作用。縮在「容易」的圈子裡從來無補於事。如同探險家一般,數學家也有著征服難題的渴望,因為在那困難的山巔上,有著無盡的風光。為了難題產生的新方法、新思想,可能會開闢出意想不到的新天地。
【畫在平面上的素數分布,圖片出處:維基百科】
孿生素數的難點在於,它是一個關於素數的具體分布的問題,而我們對素數的具體分布知之甚少。素數定理只告訴我們素數的大體分布,而對於具體一個個素數的位置卻無能為力。如同繁星,素數點綴著自然數的夜空,放眼望去,它們朝向無限的地平線愈見稀薄。但要想分清這無限繁星中的每一顆,即使用上最好的望遠鏡,也無可奈何。
所以,在很長一段時間裡,對於孿生素數猜想,人們仍然停留在揣測和估計的層面。
首先嘗試直接猜測的,是英國數學家哈代(G. H. Hardy)和李特爾伍德(J. E. Littlewood),他們在1923年開始了一系列的猜測。
【霸氣的哈代,圖片出處:維基百科】
素數定理告訴我們,對於足夠大的自然數N,在N附近隨機抽取一個自然數n,它是素數的概率大概就是
那麼,在N附近隨機抽取一個自然數n,n和n+2是一對孿生素數的概率是否就是大概
實際上,這是所謂「第一哈代-李特爾伍德猜想」的一個特殊情況,難度甚至遠高於孿生素數猜想:它不僅隱含了孿生素數猜想,而且對具體的分布作出了精細的估計。雖然上面的論證看上去很誘人,但它並不是一個嚴謹的證明,因為它的大前提——素數是隨機分布的——本來就不成立。素數的分布有著深刻的規律,遠遠不是一句「隨機分布」所能概括的。
但哈代和李特爾伍德並非等閑之輩,作為當時英國的學科帶頭人,既然提出這個猜想,當然經過了深思熟慮。現在看來,依據之一是,望向無限,素數的分布的確看似隨機:對於那些「簡單」的操作(比如說加上2)來說,數值越大,越靠近無限的地平線,看上去也越「隨機」。所以,在考慮各種素數形式的分布時,假定素數按照素數定理的密度隨機分布,不失為一個估計的好辦法。更為重要的是,數值計算的結果也與哈代和李特爾伍德的猜測所差無幾。這更增添了我們對這個估計的信心。
然而,猜測只是猜測,不是嚴謹的證明。無論用數值計算驗證到什麼高度,有多符合,對於無限而言,都是滄海一粟。李特爾伍德本人就曾證明過一個類似的結論。
人們此前猜測,小於某一個數N的素數個數
這個例子足以說明素數可以多麼深不可測而又出人意料,同時提醒我們,面對無限,不能掉以輕心。無論有多少計算的證據,都不能輕易下定論。征服無限的工具,只有嚴謹的數學證明。
狂沙淘盡始得金
既然難以知道孿生素數具體有多少,那麼不妨換個思路:孿生素數最多能有多少呢?
這就是數學家的思路,如果正面久攻不下,那麼就從側面包圍。當難以直接得到某個量時,數學家的「本能」會指引他們,嘗試從上方和下方去逼近,證明這個量不可能小於某個下界,或者不可能大於某個上界。如此慢慢縮小包圍圈,就有希望到達最終的目標。
而在1919年,挪威數學家布倫(V. Brun)走的就是這麼一條路:他證明了,孿生素數的密度不可能超過
關於布倫常數,還有個有趣的小插曲。1994年,美國一位教授在計算布倫常數時,無意中發現當時英特爾公司的奔騰處理器在計算浮點除法時,在極稀有的情況下,會產生錯誤的結果。雖然英特爾聲明這種錯誤對於日常使用來說不足為患,但對於消費者來說,這種託辭實在難以接受。最後,英特爾不得不承諾免費更換有問題的處理器。幫助發現硬體問題,這可算是數論在現實中的一個小小應用。
【出問題的那款晶元,圖片出處:維基百科】
但布倫的證明意義遠不止於此。他的這個證明,正是現代篩法的開端。
布倫所用的篩法,根源可以追溯到古希臘的埃拉托色尼篩法。還記得我們怎麼用埃拉托色尼篩法列出素數表嗎?每次獲得一個新的素數,我們都要划去所有新素數的倍數,然後剩下最小的數又是一個新的素數。用類似的方法,我們可以估計在某個區間中,比如說在
首先,我們假設手頭上已有足夠大的素數表(大概到
這樣,剩下的數的個數就是
但這就是盡頭嗎?如果考慮三個素數的倍數,我們發現補償得又太多了,需要重新划去;繼續考慮四個素數的倍數,划去得又太多了,需要重新補償……如此一正一反,損有餘,補不足,一項一項估計下去,才能從自然數的海洋中,精確篩選出所有我們想要計算的那些素數。
但我們是否需要做到如此精細呢?在整個計算中,雖然每一項看似簡單,但簡單的代價是誤差。雖然每一項的誤差很小,但因為數目巨大,累土而成九層之台,累計誤差可以比需要估計的量還要多。所以,在現代的篩法中,過於精細反而是一種累贅。況且,我們的目的是獲得上界或者下界,所以結果無需完美,只需誤差可控。一般而言,由於越到後面的項貢獻越小,往往忽略它們的計算,直接將其計入誤差。這樣可以有效減少需要計算的項的數目,同時也能間接減少誤差。當然,如果忽略的項太多,它們引起的誤差又會太大,也會導致不夠精確的結果。
布倫相對於前人的改進,正在於此。如果盲目計算所有的項,必然深陷誤差的泥沼。而布倫則大膽截去那些貢獻很小卻占絕大多數的項,而對於剩下的項也果斷採用更粗放的近似來簡化計算。雖然看似不依章法,但通過仔細調校,布倫得以有效控制總誤差,從而獲得他想要的結果。
布倫的這個思路,開啟了解析數論之中一大類方法的大門。我們不知道怎麼數素數,是因為它們的分布實在難以捉摸。而現在,布倫的篩法指出了一條用簡單的集合來逼近素數集合的道路,這自然令數學家如獲至寶。
在更精細的篩選與更微小的誤差之中尋找那一線的平衡,這大概是篩法的醍醐。但這樣的平衡,顯然依賴於我們如何估計每一項的具體數值。可以每項分開估計,但合起來也無傷大雅。無論做法如何,估計的誤差越小,篩選可以越深入,結果也越逼近真實。即使估計方法不變,如果有更好的方法決定每一項的取捨,取貢獻大而誤差小之項,而舍貢獻小而誤差大之項,當然也能得到更好的結果。
但為何拘泥於每一項?對於每一項,為什麼要麼取要麼不取,不能站在中間立場嗎?只要能控制誤差,將每一項拆解開來,根據貢獻和誤差來賦予不同的權值,再求和,這樣的結果豈不是更精細?再者,有時不拘泥於素數,放鬆限制去篩選那些「殆素數」,也就是那些只有少數幾個素因子的數,在某些情況下也能得到更好的結果。在嚴謹的前提下,只要能做出更好的結果,數學家對於突破原有思路毫不猶豫。
這就像一場對素數的圍捕戰。數學家們拿著篩法這個工具,不斷打磨它、改裝它,不斷練習,正著用,反著用,與別的領域的工具配合著用,絞盡腦汁發明新的用法,殫精竭力用它來圍捕那些調皮的素數。欲擒故縱,反客為主,無中生有,李代桃僵,數學家們在對各種各樣素數的圍捕中,借著篩法,將一套兵法使得淋漓盡致,精彩之處,三國亦為之失色。
在篩法的力量下,孿生素數終於露出了一鱗半爪:
在1920年,同樣是布倫,證明了有無窮對9-殆素數,它們之間只相差2。所謂9-殆素數,或者更一般的
在1947年,匈牙利數學家雷尼(A. Rényi)證明了,存在一個常數
在1950年,挪威數學家塞爾伯格(A. Selberg)證明了,有無窮對整數
在1966年,義大利數學家E. Bombieri與英國數學家H. Davenport證明了,孿生素數的密度至多是
【陳景潤的雕像,圖片出處:維基百科】
在1978年,在證明了哥德巴赫猜想的(1 + 2)後,陳景潤用相同的篩法改進了雷尼的結果:他證明了,有無窮對自然數
而最新的結果則是D. Goldston、J. Pintz和C. Yildirim在2009年發表的。他們證明了,兩個素數之間的差距,相比起平均值而言可以非常小。在假定某個強有力的猜想後,他們還證明了,存在無限對素數,它們之間相差不過16,與目標的2隻有八倍的差距。但問題在於,即便16這個數目相當誘人,但他們的假定過於強大,強大得不像是對的,也使人們對他們結果的信心打了個折扣。
在整個過程中,數學家們動用了解析數論中的大量工具:L函數、西格爾零點的估計、多種版本的篩法、克魯斯特曼和的估計、自守形式,如此等等,不一而足。每樣工具,都是心血的結晶。但即便如此,我們離孿生素數猜想還很遙遠。儘管Goldston、Pintz和Yildirim的結果非常強大,但也不能在無假定的情況下,推出有無窮對素數,它們相差恰好是一個有限的確定值。
雖然只差那麼一點點。只要關於所謂「素數分布水平」的引理稍微強一點點,就能得到有無窮對相差不遠的素數的結論。但就在這個關口,人們卻處處碰壁。希望就在伸手可及之處,卻似乎總是差那麼一點點。「此路不通」的想法開始瀰漫開來。
在眾人束手無策之際,當時默默無聞的張益唐向《數學年刊》提交了一份論文。
梅花香自苦寒來【張益唐,圖片出處:新罕布希爾大學】
一份三十公分的義大利麵包,縱向剖開,抹上金槍魚泥,放上四片乳酪,放到烤爐烤一分鐘,撒上生菜,鋪上酸黃瓜和番茄,包起來,切成兩半,就是又一個三明治。
這也是張益唐曾經蹉跎的歲月。
在博士畢業後,因為種種原因,雖有真才實學,但張益唐未能在學術界找到一份工作。為了生活,他不得不打工維持生計。即使在他的同學幫助他,找到新罕布希爾大學的一份代課講師工作後,即使在轉正成為一名大受學生好評的講師後,正式而言他仍不是一名研究人員。
時運不齊,命途多舛;馮唐易老,李廣難封。
但數學無需官方認可,研究也不需要正式的職位。張益唐受過正式的數學研究訓練,有紮實的功底,有充分的能力,知道怎麼去做研究,心裡也時刻揣著數學。即使沒有正式的職位,他骨子裡仍然是一位研究數學的學者。
而他心裡裝著的,正是素數的分布問題,特別是孿生素數。即使沒有正式的研究職位,他仍然做著一名研究者會做的事。他緊跟當前解析數論學界的發展,閱讀了J. Friedlander和H. Iwaniec在篩法上的突破性工作,閱讀了Goldston,Pintz和Yildirim關於素數間隔的工作,還有很多不同的新工作。他思考著新的方法,嘗試沿著前人的路徑走下去,相信能用新的技巧,把道路走通,證明有無窮對相差不遠的素數。
但這談何容易!即使從Goldston等人強有力的方法出發,要得到想要的結果,也難倒了眾多學者。張益唐花了三年時間,不斷嘗試新的方法,屢戰屢敗,屢敗屢戰。數學研究,莫不如是。
終於,在2012年6月,他到朋友家作客時,靈光一閃,找到了開啟關鍵的鑰匙。
要說起來,張益唐的方法並非那種橫空出世的新構想,而是利用現有的工具,用新的策略將它們組合起來,再加上一點點新的思想。Goldston等人所用的篩法相對精細,但卻稍欠迴旋餘地,而張益唐稍稍放鬆了這個篩法,雖然能作出的估計稍欠精細,卻換來了更大的游刃之餘,得以對篩法中誤差與精細的天平作出更精巧的調整,結合一些新的結果,特別是Iwaniec等人的工作,反而能獲得更好的估計。箇中精彩之處,恕筆者學識淺薄,難以一一盡述。
用他的新篩法,張益唐證明了,有無窮對素數,它們相差不過七千萬。他將他的新方法與新結論,用簡潔明了的語言,寫成了一篇論文,投稿到數學界的頂級期刊《數學年刊》。
這篇論文名為Bounded gaps between primes(《素數間的有界間隔》)。
收到這篇論文的編輯想必十分意外。在一所不起眼的大學做著講師的工作,在數學的研究共同體中也不活躍,之前一篇論文還是十多年前發表的,這樣的一位默默無聞的數學家,突然聲稱自己解決了一個困擾眾多學者幾十年的問題,引起的第一反應自然是懷疑。但畢竟,數學證明就是他學識的證明,他的論文寫得如此清楚明白,而所用的方法又是如此合情合理,這衝破了原有的一點點懷疑。編輯認為,張益唐的結論很可能是對的,而他的方法對於解析數論而言,也可能是個重要的進步。
因為很多數學證明都相當艱深晦澀,即使是同一個領域的專家,有時也要花上一大段時間來咀嚼揣摩,才能斷定證明是否無誤。所以,數學論文的審稿時間通常不短,少則數月,多則數年,期間匿名審稿人通常需要通過編輯與作者多次通信,才能決定一篇論文的命運。而張益唐的論文是如此激動人心,編輯認為他們等不起如此漫長的時間,於是對他的論文進行了「特殊對待」。他們請了篩法方面的大家Iwaniec教授與另一位匿名審稿人(可能是Goldston)來審核這篇論文,很快就有了迴音。
兩位審稿人都認為這篇文章沒有明顯的錯誤。實際上,評審報告中寫著這樣的評價:「論文的主要結果是第一流的」,「在素數分布領域的一個標誌性的定理」。從論文寄出到審稿結束,僅僅花了三個星期的時間。
自此,消息不脛而走。在哈佛大學的丘成桐教授,知悉這個消息之後,很快邀請了張益唐來哈佛做關於他的工作的學術報告。消息很快在數學界與新聞界傳開,張益唐幾乎是一夜之間,從默默無聞變成舉世知名。據說,他的妻子聽說有記者要採訪時,跟張益唐講的第一件事,就是把髮型整理一下。
作為勵志故事,這個結尾再好不過了。
路漫漫其修遠兮當然,故事仍未結束。
在數學界中,對於久攻不下的問題,一旦有人打破一個缺口,其他人很快就會跟進,把缺口弄得更大。張益唐的結果也不例外。
在張益唐的論文中,他給出的結果是,存在無數對相鄰素數,它們的差相差不過7000萬。但這只是一個估計,並非張益唐的方法能得到的最好結果。在論文出爐後,一些數學家吃透了新方法,開始試著改進這個常數。
張益唐的論文在5月14號面世,兩個星期後的5月28號,這個常數下降到了6000萬。
僅僅過了兩天的5月31號,下降到了4200萬。
又過了三天的6月2號,則是1300萬。
次日,500萬。
6月5號,40萬,連原來的百分之一都不到。
在筆者寫下這行的今天,剩下的只有區區的25萬。
這些結果,可以說是互聯網的結晶。這樣快的改進速度,對於僅僅依靠一年發行數次的期刊做研究的時代,完全是不可想像的。而在今天,數學家們在網上,你一言我一語,不停發布最新的思考和計算,以最高的速度,匯聚所有人的智慧,才能創造出如此奇觀。
張益唐帶來的影響不止於此。利用他的新方法,可以解決更多的問題。Pintz指出,從張益唐的工具出發,可以得知存在一個常數
實際上,大數學家Erd?s在1955年就猜測,相鄰兩對素數差的比值,可以要多大有多大,要多小有多小。而同樣藉助張益唐的工具,Pintz不僅證明了這個猜想,而且證明了比值之差以不低的速度趨向於兩極分化。用他本人的話來說:在剛剛過去的幾個月里,一系列十年前會被認為是科幻小說的定理都被證明了。
但孿生素數猜想本身又如何呢?我們知道,如果將張益唐論文中的常數從7000萬改進到2,就相當於證明孿生素數猜想。既然現在數學家們將常數改進得如此的快,那麼我們是否已經很接近最終的目標呢?
很遺憾,實際上還差很遠。
張益唐的方法,本質上還是篩法,而篩法的一大問題,是所謂的「奇偶性問題」。簡單來說,如果一個集合中所有數都只有奇數個素因子,那麼用傳統的篩法無法有效估計這個集合至少有多少元素。而素數組成的集合,恰好屬於這種類型。
正因如此,當陳景潤做出哥德巴赫猜想的突破性結果(1 + 2)時,他得到的評價是「榨乾了篩法的最後一滴油」。因為如果只靠篩法,是無法證明哥德巴赫猜想的。(1 + 2)是篩法所能做到的最好結果。
但數學家們從不固步自封。要想打破「奇偶性問題」的詛咒,可以將合適的新手段引入傳統篩法,籍此補上篩法的缺陷。張益唐的出發點——之前提到Goldston,Pintz和Yildirim的結果——正是這種新思路的成果。但對於孿生素數猜想而言,這些進展仍然遠遠不夠。學界認為,雖然不能斷定張益唐的方法,即使經過改進,是否仍然不能解決孿生素數猜想,但可能性似乎微乎其微。
但不能低估人類的才智。發明割圓術的劉徽,他對於無知的態度更適合我們:
敢不闕疑,以俟能言者!
參考資料:
Bounded gaps between primes, Yitang Zhang, Annals of Mathematics
Open question: The parity problem in sieve theory, Terence Tao, http://terrytao.wordpress.com/2007/06/05/open-question-the-parity-problem-in-sieve-theory/
Are there infinitely many twin primes?, D. A. Goldston, http://www.math.sjsu.edu/~goldston/twinprimes.pdf
關於相鄰素數之差的筆記(張益唐及其他), 木遙, http://imaginary.farmostwood.net/592.html
Polymath上常數改進的頁面:http://michaelnielsen.org/polymath1/index.php?title=Bounded_gaps_between_primes
張益唐和北大數學78級, 湯濤, 數學文化, http://www.global-sci.org/mc/readabs.php?vol=4&no=2&page=3
160相關文章數學突破獎解析:告訴你真實的數學研究
計算的極限(三):函數構成的世界
計算的極限(二):自我指涉與不可判定
計算的極限(一):所有機器的機器,與無法計算的問題
希爾伯特之夢,以及夢的破滅
推薦閱讀:
※身旺財弱的八字,最宜財地而發!
※發不了財的11種男人風水·你占幾條?
※這本在日本賣到脫銷的書,內容簡直喪心病狂,能堅持看完都是大神
※C語言求梅森素數
※一輩子發不了財的面相