狄拉克的方程遊戲

本文是2004年諾貝爾獎得主、著名理論物理學家維爾切克(F. Wilczeck)所著的高級科普著作《奇妙的現實》(Fantastic Realities)中的部分章節。由於各種原因,這些章節在譯著出版時被刪除了。但其內容於普及和深化理解現代物理卻是非常重要的。《現代物理知識》得到了原作者的首肯,從捨棄的章節中挑選了部分章節翻譯發表。現在刊登的這一部分,專門討論了量子場論的發生與發展。可稱之為量子場論通俗入門。

撰文 | 維爾切克

翻譯 | 丁亦兵、喬從豐、 李學潛、沈彭年、任德龍

本文經授權轉載自「中科院高能所」。

狄拉克

不可否認:這些數學公式是獨立存在的,並且有著它們自己的智能;它們比我們更聰明,甚至比發現它的人更聰明;我們從它們那裡得到的要比原來賦予它們的多得多。

——H. 赫茲,關於麥克斯韋的電磁學方程

我做的大量工作只不過是用方程玩遊戲,看看它們能給出什麼。

——P.A.M.狄拉克

它恰恰給出了人們所需要的電子的特性。這對我來講真是一筆出乎意料的獎金,完全出乎意料。

——P.A.M.狄拉克 關於狄拉克方程

在所有的物理學方程中,狄拉克方程或許是最 「不可思議」的。它的推導最直截了當,極少受實驗的約束,是一個具有最奇異和最驚人影響的方程。

1928年初(原始論文的接收日期是1月2日),一個剛從電力工程轉行到理論物理的25歲的年青人保羅·阿德里安·莫里斯·狄拉克(1902~1984)推導出了一個引人注目的方程,這個方程後來一直被稱之為狄拉克方程。狄拉克的目標非常具體,即瞄準了當時的熱門課題。他想寫出一個能比已有的一些方程更精確地描述電子行為的方程。因為那些方程要麼只考慮了狹義相對論,要麼僅考慮了量子力學,但從未兩者兼顧。當時一些更有名氣的和更有經驗的物理學家也正在研究同樣的課題。

不同於那些物理學家,也不同於偉大的經典物理學家牛頓和麥克斯韋,狄拉克並沒有從對實驗事實進行詳細的研究開始。他只是利用幾個基本的事實和所謂的理論上的必要條件來指導研究工作,其中的一些條件現在已經知道是錯誤的。狄拉克試圖用一個簡潔的、數學上自洽的方案來具體表達這些原理。誠如他所言,通過「方程遊戲」,他無意中發現了一個特別簡單、優美的答案。當然,這就是我們現在稱之為狄拉克方程的方程式。

狄拉克方程的一些推論可與已有的實驗觀測數據做比較。它們很有效,解釋了一些用別的方法都極難理解的結果。特別是下面就要說到的,狄拉克方程成功地預言了電子永不停息地自旋,因而它們相當於小磁鐵棒。它甚至預言了自旋的速率和磁性強度。但有些結果似乎與顯而易見的事實不一致。狄拉克方程明顯地包含了這樣的一些解,它們似乎描寫常規的原子在一瞬間自發地消失成光猝發的方式。

幾年的時間裡,狄拉克和其他物理學家都在與一個異乎尋常的佯謬奮爭。一個方程因其能正確無誤地解釋很多精確的實驗結果且又能極端漂亮地去引導物理而被認為是「顯然正確」的——但又怎麼會具有明顯災難性的錯誤呢?

狄拉克方程已成為基礎物理賴以運轉的支柱。在保持對其數學形式信任的同時,物理學家不得不重新審視方程中那些符號的意義。這是令人困惑的、傷透腦筋的重新審視,在其間,沃納·海森堡在給他的朋友沃爾夫岡·泡利的信中寫道,「現代物理最可悲的篇章就是狄拉克理論和允許其存在」,並且「為了不會因狄拉克而煩惱,我決定改變一下去做作些別的事情……」。正是在這個時刻,真正的現代物理開始了。

一個引人矚目的結果是對反物質的預言——更精確地講,應該存在一種新的粒子,它具有與電子相同的質量和相反的電荷,並且能與電子湮滅成純能量。1932年,卡爾·安德森通過細心地檢查宇宙射線徑跡很快地找到了這種類型的粒子。

更為深入涉及的結果是我們將完全重寫描述物質的基礎。在這種新物理中,粒子只是瞬息存在。它們可以自由地產生和消滅;確實,它們的短暫存在和轉化是一切相互作用的源泉。真正基礎的東西是無所不在且具轉換能力的以太:量子場。這些就是構成我們極其成功的現代物質理論基礎(經常被毫無詩意地稱為標準模型)的概念。儘管狄拉克方程本身被徹底地重新解釋並廣泛地推廣,但它從沒被拋棄,仍是我們理解自然的核心支柱。

1狄拉克的問題和自然的統一

狄拉克發現的直接原因以及他考慮這個問題的方法是調和兩個成功的高級物理理論的需要,當時這兩個理論已經有些不同步。到1928年,愛因斯坦的狹義相對論誕生已有20多年,已經被很好地理解和完全地證實。(這裡,描述引力的廣義相對論不在我們的討論範圍之內。引力在原子尺度上非常微弱,可以忽略。)另一方面,儘管海森堡和薛定諤的新量子理論是個相當年輕的理論,它們已提供了對原子結構的深入了解,並且成功地解釋了很多原先很難理解的現象。顯然,他們抓住了原子中電子動力學的基本特徵。困難在於,海森堡和薛定諤給出的方程不是以愛因斯坦的相對論力學為基礎,而是以牛頓的古老的力學作為出發點。對所有速度比光速小得多的系統,牛頓力學是一個非常出色的近似,它包括了原子物理學和化學中的許多有趣的情況。然而,能用新量子理論處理的那些原子光譜的實驗數據非常精確,以致對「海森堡-薛定諤預言」的微小偏離也能觀測到。所以存在著強烈的「實用」動機去尋找一個基於相對論力學的、更精確的電子方程。不僅年輕的狄拉克,而且還有其他幾位資深物理學家也在尋找這樣的方程。

事後,我們能察覺到更多的既古老又基本的二重性在起作用,如:光相對於物質;連續相對於分立。這些二重性為實現對自然界統一描述的目標設置了巨大的障礙。在狄拉克和他的同代人試圖調和的理論中,相對論是光和連續的產物,而量子理論是物質和分立的產物。在狄拉克的革命按其規律發展之後,在思路拓展的觀念混合物,即我們稱其為量子場論中,所有的二重性都被協調了。

光/物質和連續/分立這些二重性有著深刻的含義。最早的有感知力的原始人類就注意到了它們。古希臘人已經清晰地把它們表述了出來,並為此展開了辯論,但毫無結論。特別是,亞里士多德把火和土作為初始元素——光相對於物質。他反對原子論者,贊同充滿基本物質的空間(「自然憎惡真空」)——維護連續,反對分立。

這些二重性並沒有因經典物理的成功而消除;實際上,它們的矛盾更尖銳了。

牛頓的力學最適合描述剛體在空間中的運動。牛頓本人在很多地方猜測過這些二重性的哪一面可能占首要地位,而牛頓的追隨者們則強調他的「堅硬的、有質量的、不可穿透的」原子是自然的基本組分。甚至用粒子作為光的模型。

19世紀初期,一個截然不同的光的圖像獲得了巨大的成功,基於這個圖像,光是由波組成的。物理學家們都相信,應該存在一種連續的、充滿空間的以太來承載這些波。法拉第和麥克斯韋的發現改進和強化了這個觀點,將光等價於電磁場的作用,而電磁場本身就是充滿空間的連續實體。

如同路德維格·玻爾茲曼所做的那樣,麥克斯韋本人還成功地展示,如果氣體是由許多很小的、分立的、明顯分離開的原子組成,且這些原子可在除去原子之外的空虛的空間中運動,那麼所觀察到的氣體的性質,包括很多令人驚奇的細節,都可以得到解釋。此外,J. J.湯姆孫從實驗上,亨德里克·洛侖茲從理論上,都證實了作為物質基本組元的電子的存在。看來電子是牛頓所欣賞的那種不可消滅的粒子。

這樣在20世紀開始時,具有兩種完全不同的理論特色的物理就不得不令人不舒服地共處了。麥克斯韋的電動力學是一個沒提到質量的電磁場和光的連續理論。而牛頓的力學則是分立粒子的理論,它們唯一強制的性質是質量和電荷。

早期的量子理論沿著這種二重性的分叉向兩個主要分支發展,但有一些交匯的跡象。

一個分支是處理光的,它始於普朗克關於輻射理論的工作,而在愛因斯坦的光子理論中達到了頂峰。它的中心結論是光以不可分割的最小單位,即光子的形式出現,光子的能量和動量正比於光的頻率。當然,這個分支就確立了光的類粒子的一面。

第二個分支始於玻爾的原子理論,而於處理電子問題的薛定諤波動方程處達到了巔峰。它確定繞原子核運動的電子的穩定組態與波振動的規則模式有關。這個分支建立起了物質的類波特性。

這樣一來,基本的二重性問題就緩解了。光有點像粒子,電子有點像波。但鮮明的對比依然存在。特別是有兩個差別將光和物質明確地區別開來。

首先,如果光是由一些粒子組成的,那麼它們必須是一些很奇特的具有內部結構的粒子,因為光可以被極化。為合理地處理光的這種特性,它的粒子必須具有某種相應的性質。若只說明一束光是由如此如此多的具有這般這般能量的光子組成,這些事實會告訴我們光束有多亮,是什麼顏色,但不能告訴我們它是怎樣極化的,因此這種對光束的描述是不充分的。要得到完整的描述,還必須能夠說出光束有什麼樣的極化方式,這意味著每一個光子必須以某種方式攜帶能保持光的極化記錄的箭頭。這似乎使我們背離了基本粒子的傳統觀念。如果存在箭頭,它是由什麼構成的?為什麼它不能與粒子分離開來?

第二點而且也是更為深刻的一點,即光子是瞬時即逝的。因為當你打開手電筒時,光可被輻射;也因為你用手蓋住了手電筒,光可被吸收。所以光的粒子可以被產生或消滅。光以及光子的這種基本的和熟悉的特性使我們遠遠背離了基本粒子的傳統觀念。物質的穩定性似乎要求不可消滅的組分,它們具有與瞬時即逝的光子根本不同的性質。

狄拉克方程和由它引發的危機最終迫使物理學家去超越所有這些二重性。其結果導致了一個統一的物質觀念,這當然是人類才智最偉大的成就之一。

2早期的報償:自旋

狄拉克力圖調和量子力學與狹義相對論。他認為——我們現在知道這是錯誤的——量子理論需要一類被數學家稱之為一階方程的特別簡單的方程。不必介意他為什麼會這樣想,或者準確地說一階意味著什麼;他想要的是在一定程度上非常精確的、有可能最簡單的一類方程。這就產生了壓力,因為找到一個既在這種意義下簡單又與狹義相對論要求相容的方程是不容易的。為構造這樣一個方程,狄拉克不得不放寬討論的措辭。他發現採用單個的一階方程不能達到他的目的——他需要一個複雜關聯著的四個方程的系統,實際上「我們所指的」狄拉克方程正是這樣的一個系統。

兩個方程是最受歡迎的。而四個方程一開始就是一個大問題。

首先,看看好的一面。

儘管玻爾理論對原子光譜給出了一個不錯的粗糙的解釋,但仍存在著很多細節上的偏離。其中一些偏離與能夠佔據每一條軌道的電子數目相關,另一些則涉及原子對磁場的響應,顯示於原子的譜線移動。通過對實驗證據的仔細分析,沃爾夫岡·泡利證明了,只有嚴格限制佔據任意給定軌道的電子數目,玻爾模型才能描寫複雜原子,儘管只是粗糙的描述。這就是著名的泡利不相容原理的起源。今天我們知道這個原理的形式是「只有一個電子可以佔據一個給定狀態。」但泡利的原始提議沒有這麼簡潔;它有一些使人煩惱的難懂的文字。可以佔據一個給定玻爾軌道的電子數不是一個,而是兩個。泡利晦澀難懂地提到一種「經典上不可描述的兩重性」,但——不用說——沒有給出任何理由。

1925年,兩個荷蘭大學生塞繆爾·哥德斯密特和喬治·烏侖貝克提出了一種磁響應問題的可能解釋。他們展示,假如電子確實是個微小的磁體,則偏離就會消失。他們模型的成功要求所有電子必須具有他們計算出來的相同的磁性強度。他們接著建議了一個電子磁性的機制。電子當然是帶電荷的粒子。做圓周運動的電荷產生了磁場。所以如果電子由於某些原因永遠繞自身的軸旋轉,它們的磁性就可能得到解釋。這種電子內稟自旋還會有一個額外的好處。如果旋轉速度是量子力學所允許的最小值,則泡利的「兩重性」就可以解釋了。自旋的大小不能隨意變化,只有方向向上或向下方的選擇。許多知名的物理學家都對哥德斯密特和烏侖貝克的觀點持懷疑態度。泡利本人也試圖勸阻他們不要發表他們的工作。一則,他們的模型似乎要求電子以極高的速度旋轉,在電子錶面,速度可能超過光速。再則,他們也沒有給出是什麼東西把電子維繫在一起。如果它是電荷的延展分布,而且所有的電荷都同號,則它將會飛散開——而靠引入離心力,旋轉只會使問題更糟。最後,在他們對電子磁性強度和自旋大小的要求之間存在著定量上的不匹配。這兩個量的比率由一個稱為迴轉磁比,記為g的因子所決定。經典力學預言g=1,然而為了擬合數據,哥德斯密特和烏侖貝克假定g=2。除去這些十分合理的異議,他們模型的結果與實驗觀測一致的記錄繼續頑強地保持著!

進入到狄拉克的理論。在低速情況下,他的方程組有這樣的一類解,在方程的四個函數中,只有其中的兩個對方程的解有可觀的貢獻。這是一種不同的兩重性。在這裡,它是由於落實基本原理而自動出現的,並且確定無疑不是必須特別引入的。更奇妙的是,不需要做進一步的假設,狄拉克就可以用他的方程算出電子的磁性,得到g=2。狄拉克寫於1928年的傑作沒有一個廢字。在展示這個結果時,他簡單地說道「磁矩正是在自旋電子模型中所假設的」。幾頁之後,他推演出進一步的必然結果,並簡明地總結道「這樣在一級近似下,目前理論給出的能級與C.G.達爾文所得到的能級相同,它們與實驗是一致的。」他的這些結果有著強烈的說服力,用不著誇大。從那以後,就離不開狄拉克方程了。無論產生什麼樣的困難——有些困難挺大、挺明顯——它們都將是爭鬥的場合而不是丟棄的機會。這種璀璨寶石般的深刻見解將是無價之寶。

正如我所提到的,儘管他善於思維的出發點非常與眾不同和更加抽象,狄拉克以哥德斯密特、烏侖貝克以及他們模型的實驗成果開始了他的論文。只有在第二段,他確實顯露他的才能。他所講的完全切合我上面所強調的主題。

為什麼大自然為電子選擇這樣一個特殊的模型而不滿足於點電荷,這個問題依然存在。人們想要找出先前將量子力學用於點電荷的方法中的一些不完備性,當這些不完備性被移除後,整個二重性現象將成為不需要任意假設的必然結果。

因此,狄拉克本身不是在提供一個新的電子模型。恰恰相反,他是在定義一種新的不可約的物質性質,它是事物天生固有的,特別是在相對論和量子力學自洽地起作用時,甚至在無結構點粒子這種最簡單的可能情況下,這種特性也能出現。電子恰好是物質的這種最簡單形式的具體表現。狄拉克保留了哥德斯密特和烏侖貝克「自旋」中的一些有價值的性質,特別是它的固定大小和它的磁性行為,它們有助於描述已觀測的事實,但卻是在深刻得多的基礎上。他們模型的隨意性和令人不滿意的特徵都被擺脫了。

我們正在尋找一個箭頭,它將是物質基本組元的一個必要和不可分割的部分,比如光子的極化。情況就是這樣!

電子的自旋可推演出許多實用的結果。它是鐵磁性的起因,並使通電線圈中心處的磁場增強,它構成現代動力技術(電動機和發電機)的核心。通過操控電子自旋,我們可以在非常小的體積內貯存並讀取大量信息(磁帶、磁碟驅動)。甚至小得多的和更不易使用的原子核自旋也在現代技術中起著很大的作用。用無線電波或磁場操控這樣的自旋,並感知它們的響應,是醫學上非常有用的磁共振成像(MRI)的基礎。如果沒有這種只能通過最基礎的認識才能帶來的對於物質的精妙控制,這種應用將是不可想像的(確實如此!)。

通常的自旋,特別是狄拉克對磁矩的預言,在基礎物理後續的發展中也有著巨大影響。波利卡普·庫什和他的合作者在20世紀40年代發現了對狄拉克g=2的結果的微小偏離。它們提供了一些最早的虛粒子效應的定量證據,這是量子場論的一個深奧而且典型的特徵。對質子和中子來說,與g=2的明顯偏離早在20世紀30年代就被觀測到了。這是一個早期的跡象,它暗示:質子和中子不是與電子有著相同意義的基本的粒子。但是,我正在超前於我們的故事了……。

3巨大的驚奇:反物質

現在是壞的一面。

狄拉克方程由四個分量組成。也就是說,它含有四個分離的波函數以描述電子。正如我們剛才討論的,兩個分量具有誘人和直接的成功解釋,它們描寫電子自旋的兩個可能方向。相比之下,額外的一對分量乍看起來是很有問題的。

事實上,額外的兩個方程含有負能的解(對自旋的任意一個方向)。在經典(非量子)物理中,額外解的存在會令人為難,但不一定是災難性的。因為在經典物理中可以簡單地不選用這些解。當然這樣做迴避了為什麼大自然不選用它們的問題,但這是一個邏輯自洽的做法。在量子力學中,這種選擇恰好是不能用的。在量子物理學中,一般地講,「不禁戒的那些都是必須要的」。在手邊的這個具體例子中,這一點是非常具體和精確的。在適當的情形下,電子波動方程的所有解都代表著電子的可能行為。在狄拉克方程中,從電子的其中的一個正能解出發,你就可以計算出它放出一個光子並躍遷到其中的一個負能解的速率。總體上,能量必須守恆,但那不成問題——它只不過意味著發射出的這個光子的能量會比放出它的電子的能量還要高!不管怎麼說,這個速率快得離譜,比一秒短得多。所以你不能總是忽略負能解。由於從來沒有觀測到過電子異常地放出比它初始的能量還要多的能量,基於這一事實,狄拉克方程的量子力學存在著一個嚴重的問題。

狄拉克非常清楚這個問題。在他的原始論文里,他簡單地承認道:「對第二組解W(能量)為負值而言。在經典物理中可以通過隨意捨棄W為負的那些解來克服這個困難。在量子理論中則不能這麼做,因為,一般地說,一個微擾會引起從W為正態到W為負態的躍遷。……所以這樣得到的理論仍然只是一種近似,但它似乎在沒有隨意假設的情況下,已能足夠好地解釋所有的兩重性現象。」然後就把問題放在那裡了。這就是前面已經引述過的、激起海森堡向泡利發泄的環境。

在兩年後的1929年年底,狄拉克提出一個建議來解決這個問題。這個建議利用了泡利不相容原理,根據這個原理,不會有兩個電子滿足這個波動方程的同一個解。狄拉克所提議的是一個關於真空的全新概念。他提議我們所認為「空」的空間實際上被負能電子擠得滿滿的。事實上,按照狄拉克建議,「空」的空間實際上含有滿足所有負能解的電子。這個建議最大的優點是解釋了引起麻煩的、從正能解到負能解的躍遷。一個正能電子不可能躍遷到一個負能解,因為總是有另外一個電子已經佔據在那裡,而泡利不相容原理不允許第二個電子加入。

我們認為的真空實際上已經充滿了東西的這種說法,乍聽起來讓人感到不可思議。但仔細想想,有什麼不可以的呢?進化把我們塑造成能夠感知對我們賴以生存和繁衍的世界上的方方面面。因為那些幾乎不會受我們影響的、世界上不變的方面在這裡是不起作用的,我們幼稚的感知力覺察不到它們似乎不應該是特別奇怪的。不管怎樣,我們沒有理由去期盼:有關什麼是怪誕的或不大可能發生的幼稚直覺會對構建微觀世界基本結構模型提供可靠的指導,因為這些直覺起源於一個完全不同領域的現象。但是我們必須接受它的到來。一個模型的有效性必須根據模型結果的成效和精確度來判斷。

所以狄拉克對冒犯一般常識毫不畏懼。他十分恰當地將精力集中於他建議的可觀測的結果。

因為我們正在考慮這樣的觀點:「空」的空間的常規狀態遠非空虛,那麼用一個不同的、比較含糊的字來表示它是有幫助的。物理學家喜歡用的詞是「vacuum(真空)」。

在狄拉克的建議中,真空充滿了負能電子。這使真空成為一個具有自身動力學特性的介質。例如,光子可以同真空相互作用。可能會發生的一件事是,如果你將光照在真空上,只要光子具有足夠的能量,那麼一個負能電子就可以吸收其中一個光子,跳到正能解中。這個正能解作為一個常規的電子將被觀測到。但在末態的真空中也產生了一個空穴,因為原本被負能電子佔據著的解不再被佔有了。

空穴的思想,就動力學真空而言,是驚人的創新概念,但並非前所未有。狄拉克利用了與含有很多電子的重原子理論的類比。在這樣的原子中,有些電子對應於這樣的波動方程的解,在那裡,電子被緊緊地束縛在帶大量電荷的原子核附近。要把這樣的電子打出來需要大量的能量,所以在通常情況下,它們表現為原子不發生變化的一面。但如果其中一個這樣的電子吸收了一個高能光子(X射線光子)從原子中被彈射出來,那麼原子正常狀態的變化就以這個電子的缺失為標誌。相對比之下,提供負電荷的電子的缺失就像一個正電荷。這個有效正電荷會沿著失去電子的軌道運動,所以它具有帶正電粒子的性質。

基於這個類比和其他一些舉手之勞的觀點(hand-waving arguments),在這篇幾乎沒有方程式的短短的論文中,狄拉克提出真空中的空穴是帶正電的粒子。那麼,一個光子將一個真空中的負能電子激發到正能態的過程就可以被解釋為一個光子產生了一個電子和一個帶正電的粒子(空穴)。反過來,如果事先存在一個空穴,那麼一個正能電子就可以發射出一個光子並佔據空的負能態。這被解釋為一個電子和一個空穴湮滅為純能量。這裡,我涉及的是一個光子被發射出來,但這只是一種可能性。還有可能發射出多個光子,或其他任意形式的輻射,它們帶走了釋放出的能量。

狄拉克第一篇空穴理論論文的標題為《電子和質子的理論》。當時質子是唯一知道的帶正電的粒子。所以試圖把這種假定的空穴認定為質子是很自然的。但不久這種認定引起了十分嚴重的困難。確切地說,我們剛才討論的兩種過程——電子-質子對的產生和電子-質子對的湮滅——從來沒有被觀測到過。第二個過程更有問題,因為它預言氫原子會在幾微秒時間內自發地自我湮滅——幸虧它們不是這樣。

把質子視為空穴的看法還牽涉到一個邏輯上的困難。基於方程的對稱性,可以證明空穴必須具有和電子相同的質量。但是,一個質子當然應該具有比電子大得多的質量。

1931年,狄拉克收回早先認為空穴就是質子的觀點,接受了他自己的方程的邏輯結果,並提出了一個動力學真空的要求「一個空穴,如果存在的話,會是一種實驗上尚未發現的新的基本粒子,它具有與電子相同的質量和相反的電荷。」

1932年8月2日,一位美國實驗家卡爾·安德森正在研究宇宙射線在雲霧室留下的徑跡的照片,他注意到一些徑跡,它們如同所預期的電子那樣的失去能量,但卻被磁場偏轉到相反的方向。他把這個現象解釋為暗示著一種新粒子的存在,現在稱之為反電子或正電子,它具有與電子相同的質量但相反的電荷。具有諷刺意味的是,安德森完全不知道狄拉克的預言。

在距狄拉克的房間幾千英里之外的聖約翰,狄拉克的空穴——他的理論設想及其修訂版的產物——被發現了,是從帕薩迪娜的天空降下來的。所以從長遠的觀點看,「壞」消息結果成為「更好」的消息。負能的青蛙成為正電子王子。

如今正電子已不再是令人驚奇的東西,而是一種工具。一個著名的應用是拍攝正在活動的大腦的照片——PET掃描,即正-負電子斷層攝影術。正電子是如何進入你頭部的呢?它們是通過注射把一些特殊的分子偷偷地送入的,這些分子包含有一些原子,它的放射性核將衰變出產物之一的正電子。這些正電子走不了多遠就會與附近的電子發生湮滅,通常會產生兩個光子,它們穿過你的顱骨跑出,就可以被探測到。然後你可以重建原始分子的去向,映射出新陳代謝,也可以研究光子在出射過程中的能量損失,得到一個密度分布圖,最後得到腦組織的圖像。

另一著名的應用是用於基礎物理。你可以同時將正電子和電子加速到很高能量,並把兩束粒子引到一起。然後正電子和電子會湮滅,產生高度密集形式的「純能量」。在過去的半個世紀中,基礎物理絕大部分進展都是基於世界各地一系列大型加速器上的這類研究,其中最新最大的是位於日內瓦之外CERN(歐洲核子研究中心)的LEP(大型電子-正電子)對撞機。稍後我會討論這個物理的極具魅力的要點。

狄拉克空穴理論的物理思想,如我提到的,具有部分早期重原子研究的根源,也大規模地反饋到固體物理中。在固體中,我們有一個儘可能低的能量的電子的參考組態或基本組態,在那裡電子佔據了上至一個確定能級的所有可能的狀態。這個基本組態類似於空穴理論中的真空。也存在著一些較高能量的組態,在那裡一些低能態沒被任何電子佔據。在這些組態中,有一些通常會被電子佔據的空位或「空穴」——這是它們在技術上的稱謂。這樣的空穴在很多方面的行為都像帶正電的粒子。固體二極體和晶體管都是基於對處於不同材料界面處的空穴和電子密度的巧妙控制。也有一種可巧妙地把電子和空穴引導到一個它們可以結合(湮滅)的地方的可能性。這使你可以設計出一個能非常精確控制的光子源,導致了諸如LED(發光二極體)和固體激光這樣的現代技術支柱。

在1932年後的若干年中,許多附加的反粒子事例被觀測到。事實上,對每一個已經發現的粒子,其相應的反粒子也都被發現了。有反中子、反質子、反m子(m子本身是一個非常類似於電子的粒子,但是更重一些)、各類反夸克、甚至反中微子以及反p介子、反K介子……。其中的很多粒子都不遵從狄拉克方程,有一些粒子甚至不遵從泡利不相容原理。所以反物質存在的物理原因必須是很普遍的——比最早導致狄拉克預言正電子存在的論據要普遍得多。

事實上,存在一個非常普遍的論點:如果你同時運用量子力學和狹義相對論,則每一個粒子必須有一個相應的反粒子。這個論點的嚴密的表述需要高深的數學背景或者極大的耐心。在這裡大概地說明為什麼反物質是同時運用相對論和量子力學的合乎情理的結果將會是令人滿意的。

考慮一個粒子,讓我們給它一個名字(同時強調它可以是任何東西),不妨稱之為一個什穆,以非常接近光速的速度向東運動。根據量子力學,它的位置實際上存在一些不確定性。所以你會發現這樣的一些幾率:如果測量什穆的位置,在初始時刻,它處在期望的平均位置偏西一些的地方,稍後又在期望平均位值偏東一些的地方。這樣,在這段間隔內,它走得比你預期的要長一些——這意味著它走得更快。但是因為預計的速度基本上是光速,為容納這個不確定性需要更快的速度,它預示著將違反狹義相對論,在該理論中粒子的速度不能大於光速。這是一個佯謬。

用反粒子,你可以擺脫這個佯謬。這就需要精心策劃,讓一些怪誕的想法協調一致,這是人們想出的如何做這件事的唯一方法,它似乎就是大自然的方式。是的,其中心思想是:不確定性確實意味著,你能在狹義相對論告訴你不會出現什穆的地方發現它——但你觀測到的那個什穆不一定就和你要找的那個一樣!因為也有可能在稍後的時刻會有兩個什穆,一個原來的和一個新的。為了使其自洽,還必須存在一個反什穆,用來平衡電荷,抵消可能與額外的什穆相關聯的其他守恆量。能量的平衡又怎麼樣呢——是不是我們取出的能量比投入的更多?這裡,常常就像在量子理論中那樣,為避免矛盾,在考慮測量某物意味著什麼時,你必須是明確的和具體的。測量什穆位置的一種方法是用光照射它。但是要精確測量快速運動的什穆的位置,我們必須使用高能光子,那時也存在這樣的可能性,這樣的一個光子會產生一個什穆-反什穆對。在那個情形下——封閉的什穆圈——當報告你的位置測量結果時,你可能論及的是別的什穆!

4最深刻的含義:量子場論

狄拉克的空穴理論是絕頂聰明的,但大自然更為深刻。儘管空穴理論是內部自洽的,並且可以有廣泛的應用,但有幾個重要因素迫使我們去超越它。

第一,有一些沒有自旋的粒子,它們不遵從狄拉克方程,但它們有反粒子。這不是偶然的,正如我剛才討論的,反粒子的存在是量子力學和狹義相對論相結合的普遍結果。具體地講,例如帶正電的π+介子(1947年發現)或W+玻色子(1983年發現)在基本粒子物理中都是非常重要的角色,它們確實有反粒子π-和W-。但是我們不能用狄拉克空穴理論來理解這些反粒子,因為π+和W+粒子不遵從泡利不相容原理。因此不能把它們的反粒子解釋為由負能解填充的海中的空穴。如果存在負能解,則無論它們滿足什麼方程②,一個粒子對這種態的佔據不會阻礙其他粒子進入同一個態。這樣一來,必須用一個不同方式來避免到負能態的災難性躍遷,而這種躍遷在電子的狄拉克空穴理論中是被阻止的。

第二,存在一些電子數與正電子數之差改變的過程。一個例子是一個中子衰變成一個質子、一個電子和一個反中微子。在空穴理論中,一個負能電子被激發到一個正能態被解釋為一對正電子-電子對的產生,而一個正能電子退激發到一個未被佔有的負能態被解釋為一對電子-正電子對的湮滅。無論在哪種情況下,確實電子數與正電子數之差都不變。空穴理論不能容納這個差值的改變。所以,自然界中有一些確實很重要的過程,甚至那些明確地涉及電子的過程,很難與狄拉克空穴理論相符合。

第三,也是最後一個原因返回到我們最初的討論。我們正期待著破缺那些重要的二重性,即光/物質和連續/分立。相對論和量子力學分別使我們接近成功,而隱含自旋的狄拉克方程使我們離成功更近。但迄今為止我們還沒有到達那裡。光子是轉瞬即逝的,電子……作為實驗事實,它們也是轉瞬即逝的,這一點我剛剛提到過,但我們還沒有把這個特徵充分地納入我們的理論討論之中。在空穴理論中,電子能夠產生和湮滅,但僅當同時有正電子湮滅和產生時。這裡沒有太多的意味著無希望的矛盾。它們暗示,應該有一些空穴理論的替代理論,它適用於物質的各種形式,並把粒子的產生和消滅作為基本的現象處理。

具有諷刺意味的是,在早些時候狄拉克自己已經構建了這樣一個理論的雛形。1927年,他把新量子力學原理應用到經典電動力學的麥克斯韋方程。他展示,愛因斯坦的光以粒子——光子——形式出現的這個革命性假設就是這些原理邏輯應用的結果,並且光子的性質可以被正確地解釋。有一些常見的觀測結果,諸如光可由非光產生,比如使用一個手電筒;或被吸收和湮滅,比如被一隻黑貓。但翻譯成光子的語言之後,這意味著麥克斯韋方程的量子理論是一個產生和湮滅粒子(光子)的理論。確實,在電磁學的狄拉克量子理論中,電磁場首先是作為產生和消滅的媒介物而出現的。光子作為這種場的激發而產生,這是基本的東西。光子出現和消失,但場持續存在。這個發展的全部意義在一段時間內似乎沒有引起狄拉克和所有他同時代科學家的注意,也許恰好是因為光的明顯的特殊性(二重性!)。但它是個普遍的結構,也可以應用到那些出現於狄拉克方程——電子場——中的客體。

將量子力學原理邏輯應用於狄拉克方程得到的結果是一個類似於他在麥克斯韋方程中所發現的那種客體。它是一個消滅電子,產生正電子的客體。二者都是量子場的例子。當把出現在狄拉克方程中的那個客體解釋為一個量子場時,負能解呈現出不再有困難的完全不同的含義。正能解乘以電子的湮滅算符,而負能解乘以正電子的產生算符。在這個框架中,兩類解的區別是,負能表示產生一個正電子所需要借入的能量,而正能是消滅一個電子所獲得的能量。在這裡,負數的可能性並不比你銀行的存款更出乎意料。

隨著量子場論的發展,最終得到了狄拉克方程和空穴理論已經顯示的但沒有全部完成的那些機遇。光和物質的描述終於被放在了一個平等的地位上。狄拉克認為可以理解並滿意地說,隨著量子電動力學的出現,物理學家已經得到了足以描述「所有的化學,和絕大部分物理」的方程。

1932年,恩里科·費米通過把量子場論概念應用到遠離它們起源的地方,構建了一種成功的、包括前面提到過的中子衰變在內的輻射衰變(β衰變)理論。因為這些過程牽涉到質子——典型的「穩定」物質——的產生和消滅,古老的二重性終於被超越了。粒子和光都是衍生客體,是更深刻、更持久的真實事物,即量子場的表面表現形式。這些場充滿了所有空間,在這種意義下它們都是連續的。但它們產生的激發,無論我們把它們看作是物質的粒子還是光的粒子,都是分立的。

在空穴理論中我們有一個充滿了負能電子的海的真空圖像。量子場論中的圖像是非常不同的。但決不是回歸到單純。真空的新圖像甚至與樸素的「空的空間」有天壤之別。量子不確定性與產生和消滅過程的可能性結合在一起,意味著充滿了活力的真空。粒子和反粒子對飛快地產生和消失。我曾寫過一首關於虛粒子的十四行詩,現把它抄錄如下:

當心那看似無物的真空,

儘管你已盡全力將它清理乾淨。

總有一群肆無忌憚的傢伙,隨意克隆,

超出你的想像,在那裡不知疲倦地騷動。

它們瞬息而至,隨處舞動身影,

無論觸及何物,總有疑團重重:

我在這裡幹什麼?何物應被看重?

這些想法常使快速衰變關聯而生。

不必擔心!這個術語正把你引入迷津。

衰變不過是虛粒子繁衍生命,

這種隨意的騷動引起壯觀的反應,

那些克隆的交換,成為束縛參與者的纜繩。

是還是不是?儘管選擇似已明確,哈姆雷特卻還猶疑不定,

這些傢伙也有同樣的毛病。

5餘 波

隨著量子場論的創始,我們關於狄拉克方程的討論達到了一個固有知識的邊界。到了20世紀30年代中期,這個方程引起的緊迫的悖論已經被解決了,它最初的承諾也已完全實現。狄拉克獲得1933年諾貝爾獎,安德森獲得1935年諾貝爾獎。

後來的幾年裡,對量子場論的理解加深了,它的應用也被擴展了。用它,物理學家構建了(在驚人的嚴謹和毋庸置疑的程度上確立了)代表著可預知未來的——也許是永遠——有效的物質理論。關於這是如何發生的,以及這個理論的本質,是涉及許多其他思想的史詩般的故事,在那裡狄拉克方程同樣起著重要的但非主導的作用。但是後來的一些發展與我們主題的聯繫是如此的密切,它們自身又是如此的漂亮,故值得在此一提。

還有另一層含義,即量子場論的創立標誌了一個自然的邊界。它是狄拉克本人未能跨越的極限。就像愛因斯坦一樣,狄拉克在晚年走了一條分離的路。他不注意其他物理學家的大部分工作,並對其餘的工作也持有異議。在以他的工作開始的驚人的發展中,狄拉克本人的參與不是主要的。

QED(量子電動力學)和磁矩 與無時不在的量子場論的動力學真空相互作用修改了觀測到的粒子的特性。我們看不到假設的「裸」的粒子的特性,相反地看到的是那些由於與動力學真空中的量子漲落相互作用而「穿上了衣服」的物理粒子。

特別是,物理電子不是裸電子,它不完全滿足狄拉克的g=2。1947年珀利卡·庫什作了非常精確的測量,發現g比2大一個1.00119的因子。定量地講,這不是一個很大的修正,但它對理論物理卻是一個巨大促進,因為它提出了一個非常具體的挑戰。當時基礎物理中有如此多未能了結的問題——過多的、意料外的、新發現的粒子,包括m子、p介子和其他一些粒子,沒有令人滿意的理論能夠解釋是什麼力把原子核結合在一起,不完整的、未消化的輻射衰變的結果,高能宇宙射線的反常等等——以至於很難知道應該集中精力於什麼地方。事實上存在一個有關策略的基本哲學的衝突。

大多數年長的一代,量子理論的奠基者,包括愛因斯坦、薛定諤、玻爾、海森堡、泡利,準備了另一次革命。他們認為花費時間設法進行更精確的量子電動力學計算是徒勞的,因為這個理論肯定是不完善的,並且可能是錯的。它無法改變下述事實:要求得到精確結果的計算是很困難的,並且似乎給出的答案是無意義(無限大)的。所以老一代大師一直在尋求一種不同類型的理論,不幸的是沒有清晰的方向。有諷刺意味的是,正是新一代的理論家——施溫格、費曼、戴森和日本的朝永振一郎——扮演了保守的角色。他們發現了一種更精確計算的方法,並得到了有意義的有限結果,而無需改變基礎理論。事實上,他們所用的理論剛好就是狄拉克在二十世紀的二三十年代構建的理論。由施溫格所作的包括了動力學真空效應的劃時代計算結果是對狄拉克的g=2的一個微小的修正。它也發表於1947年,並且與庫什同年的測量驚人地吻合。許多其他的重大成果接踵而來。庫什獲得1955年諾貝爾獎;施溫格、費曼和朝永振一郎共同獲得1965年諾貝爾獎(這一延遲是難以理解的!)。

奇怪的是,狄拉克不接受這種新的做法。在早期,當使用的數學方法是陌生的和粗略的並且包含了一定量的受靈感啟示的猜測時,也許謹慎是有道理的。不過技術性的困難適時地被克服了。

費曼把QED稱為「物理學的寶石——我們最驕傲的財富。」但在1951年狄拉克寫道「近來蘭姆、施溫格和費曼以及其他人的工作是成功的……但是得到的理論是一個難看的和不完整的理論。」在他1984年後續的文章中又寫道「這些重整化規則給出的結果與實驗驚人地吻合,所以絕大多數物理學家都說這些使用的規則是正確的。我認為這不是一個充分的理由。正是因為結果碰巧與實驗符合,所以並不能證明這個理論是正確的。」

你也許會注意到年輕的狄拉克和上了年紀的他在口氣上存在著一定的差異,年輕的狄拉克像藤壺一樣附著在他的方程上,因為它解釋了實驗的結果。

今天實驗測定的電子的磁矩是(g/2)實驗= 1.00 159 652 188 4(43),而嚴格基於QED計算到高精度的理論預言是(g/2)理論=1.00 159 652 187 9(43)。其中最後兩位數字的不確定性已標出。這是在最錯綜複雜的——但卻是精確定義的!——理論計算與所有科學中最精細的——但卻是精確控制的!——實驗之間的最難的、最精確的對比。這就是費曼所說的「我們最驕傲的財富」的含義。

電子磁矩及其同類粒子μ子磁矩更精確的測定仍是實驗物理的一個重要的前沿。在現在可以達到的精度下,由於假定的新的重粒子——特別是由超對稱所預言的那些重粒子,結果將敏感於量子漲落的效應。QCD和物質的理論 質子的磁矩不滿足狄拉克的g=2,而是g≈5.6。對於中子,情況更糟。中子是電中性的,所以中子的簡單的狄拉克方程預言中子不存在磁矩。事實上,中子具有一個大約為2/3質子磁矩大小的磁矩,取向與自旋相反。由於中子是電中性的,那意味著一個無限大的g。這些磁矩值的不相符是質子和中子比電子更複雜的最早的跡象。

隨著進一步的研究,更多的複雜現象出現了。人們發現質子和中子之間的力非常複雜。令人困惑地,它們不僅依賴於粒子之間的距離,而且還依賴於它們的速度、自旋的方向以及所有這些因素的混合。事實上人們不久就明白了,它們根本不是傳統意義上的「力」。質子之間具有一個傳統意義上的力意味著一個質子的運動會受到另一個質子存在的影響,以至用另外一個質子入射到一個質子時,這個質子會轉向。實際觀測到的是,當一個質子撞擊另一個質子時,通常會出現許多粒子,其中大部分是極不穩定的。有π介子、K介子、ρ介子、Λ和Σ重子以及它們的反粒子等很多的粒子。所有這些粒子間有很強的相互作用著。因此核力的問題,一個從20世紀30年代開始的物理學前沿,變成了理解一個粒子及反應的廣闊的新世界的問題,即自然界中最強有力的東西。甚至術語也改變了。物理學家不再提及核力,而是提及強相互作用了。

現在我們知道,強相互作用所有的複雜性,在一個基礎的層面上,可由一個稱之為量子色動力學(QCD)的理論來描述,這個理論是QED的一大推廣。QCD的基本組元是夸克和膠子。有六種不同類型(「味道」)的夸克:u、d、s、c、b、t(上、下、奇異、粲、底、頂)。夸克彼此很相似,主要區別是它們的質量。只有最輕的夸克u和d,可在普通物質中找到。同QED的基本組元類比,夸克大體上扮演的是電子的角色,而膠子大體上扮演的是光子的角色。一個很大的不同是QED只有一種荷,一種光子,而QCD有三種荷,稱之為色,和八種膠子。與光子對電荷的響應類似,一些膠子對色荷有響應。另外一些膠子媒介於一種色荷到另一種色荷之間的躍遷。這樣,(比如說)一個帶藍色荷的u夸克可以放出一個膠子變成帶綠色荷的u夸克。因為總體上所有色荷必須守恆,所以這個特殊的膠子必須帶有+1單位的藍色荷和?1單位的綠色荷。由於膠子本身帶有未被抵消的色荷,QCD中存在著膠子輻射出其他膠子的基本過程。在QED中沒有類似的過程。光子是電中性的,直至非常好的近似,它們也不會與別的光子發生相互作用。QCD絕大部分的豐富性和複雜都是由這個新的特徵引起的。沒有建立在概念和現象的基礎上,而只是如此直截了當的字面上的描述,這似乎使QCD顯得既隨意又荒誕。不幸的是,在這裡我不能恰當地處理它的對稱性和數學的優美。但一些扼要的解釋已就緒……我們怎樣得到這樣的一個理論?我們如何知道它是正確的?在QCD的情形下,這是兩個非常不同的問題。通向這個發現的歷史途徑是曲折的,充滿了許多歧途和死胡同。但回想起來,沒有必要那樣做。假如合適類型的超高能加速器早些運轉的話,QCD早就會面對我們了。這種想像的歷史把我在這篇文章中討論過的大部分想法彙集在一起,形成了一個恰當的物理部分的結論。

如果電子和正電子被加速到超高能然後使它們對撞,可以觀測到兩類事例。一類事例的末態粒子為輕子和光子。對於這類事例,通常末態只是一個輕子和它的反輕子;但在約1%的事例中還有一個光子,還有約0.01%的事例中有兩個光子。這種事例的幾率及具有不同能量的粒子從不同角度出射的幾率都可以用QED計算,並且所有算出來的結果都很好。反之,如果你不了解QED,僅靠研究這些事例,你就已經能夠辨認出QED基本相互作用——即一個電子放出一個光子——的基本規則。光和物質的基本相互作用就展現在你的面前了。在另一類事例中,你會看到非常不同的東西。不同於只有兩個或最多幾個粒子飛出,而是有很多粒子產生,並且它們是不同種類的粒子。你在這第二類事例中看到的粒子是諸如π介子、K介子、質子、中子,和它們的反粒子——所有這些粒子,與光子和輕子不同,都具有強相互作用。這些粒子的角分布具有特殊的結構。它們不是獨立地向四面八方飛出。而是只在少數的幾個方向出現,形成很窄的噴射或(它們經常被稱作為的)「噴注」。大約90%的時間只有兩個沿相反方向的噴注;大致9%的時間有三個噴注,0.9%的時間有四個噴注——你可以猜出這個模式。

現在,如果你瞧上一眼,不去識別單獨的粒子,只追蹤能量動量流,那麼這兩類事例——QED的「粒子」事例和攜帶著強相互作用的粒子的「噴注」事例——看起來是一樣的!

所以(在這個想像的歷史中)人們很難抵制這樣的誘惑,即把噴注都當成粒子一樣,直接類比適用於QED的步驟,對那些攜帶不同數量、不同角度、不同能量噴注粒子的不同輻射模式的可能性提出一些規則。這種作法很成功,因為這些十分類似於QED中的那些規則,事實上確實描述了觀測到的現象。當然,所用的規則精確地就是QCD的規則,包括膠子輻射膠子的一些新過程。所有這些規則——整個理論的基本元素——可以直接從數據中推導出來。就噴注而言,「夸克」和「膠子」將是具有直接和精確可操作定義的辭彙。

至此為止,還有兩個大的概念性的疑難。為什麼實驗展示了「夸克」和「膠子」而不直接是夸克和膠子——即是噴注而不直接是粒子?怎樣把直接成功地描述了高能事例的理論概念與所有的其他強相互作用現象聯繫起來呢?在假想的基礎理論和平凡的觀測之間的聯繫,至少可以說,並不明顯。例如,你打算用在這種基礎理論中出現的「夸克」和「膠子」來構成質子。但這看起來是沒有希望的,因為用來可操作地定義「夸克」和「膠子」的噴注經常在別的一些粒子之外還含有質子。

這些問題有一個漂亮的答案。這就是QCD中的漸進自由現象。根據漸進自由,涉及能量和動量流大幅改變的輻射事例是稀有的,而僅涉及能量和動量微小變化的輻射事例是非常普遍的。漸進自由不是一個分離的假設,而是QCD結構的一個深刻的數學結果。

漸進自由乾乾淨淨地解釋了為什麼在高能電子- 正電子湮滅時含有強相互作用粒子的那類事例中會產生噴注。在電子和正電子湮滅後的霎那,馬上就會有一個夸克和一個反夸克出現。它們沿相反的方向快速運動。它們很快放出膠子,膠子本身又放出膠子,發展起了一個複雜的帶有許多粒子的簇射。但是,任憑所有的這些騷動,總體的能量和動量流沒有受到明顯的干擾。根據漸進自由,擾動能動量流的輻射是稀有的。所以有大量的多重粒子都沿相同方向運動,這個方向是由夸克和反夸克初始標定的。總而言之,我們已經產生了噴注。當其中的一個干擾能動量流的稀有事例發生時,放出的膠子也產生一個自身的噴注。於是我們就有了一個三噴注事例,等等。

漸進自由還顯示出為什麼對那些我們實際觀測到的單獨穩定的或准穩定的實體,如質子(和其他強相互作用粒子)的描述都是複雜的物體。對這種粒子,或多或少就定義而言,夸克、反夸克和膠子的組態是那些具有合理穩定程度的組合體。但是,因為夸克、反夸克和膠子都有很高的輻射幾率,沒有簡單的組態會有這種性質。唯一可能的穩定性涉及動力學平衡,在那裡系統某一部分發出的輻射會在其他部分被吸收而平衡掉。

正如實際所發生的,漸進自由是從理論上發現的(由大衛·格羅斯和我,及獨立地由大衛·波利策),並且基於很少的直接證據,QCD作為強相互作用的理論於1973年被提出(由格羅斯和我)。噴注的存在被預期到,它們的性質在實驗觀測之前已相當詳細地被理論所預言。基於這些實驗以及很多其他的實驗,如今,QCD已被接受為強相互作用的基本理論,與QED作為電磁相互作用的描述相媲美。

用QCD描寫質子、中子和其他強相互作用粒子的性質也有了巨大的進展。這雖然包含了使用高效的計算機進行的要求非常高的數值計算,但結果是值得的。它的一個亮點是我們可以在沒有重要自由參數的情況下,從第一原理出發來計算質子和中子的質量。正如我已經說明的,從最基本的觀點來看,這些粒子是夸克、反夸克、膠子的非常複雜的動力學平衡物。它們絕大部分的質量——並因此也是物質的絕大部分質量,包括人類的大腦和身體——起源於按照m=E/c2運動的這些粒子的純能量,而它們自身基本上是沒有質量的。至少在這個層次上,我們都是輕飄飄的生物。

狄拉克說過,QED描寫了「絕大部分的物理和全部的化學」。確實,它是原子(和更多的)外部結構的基本理論。在相同的意義下,QCD是原子核(和更多)的基本理論。合在一起,它們組成了一個非常完整的、得到很好檢驗的、富有成果的、實惠的物質理論。

6推理的創新力

現在我已經較為詳細地討論了「方程遊戲」如何將狄拉克引導到一個方程,這個方程充滿了他不曾預料到且以多種方式抵制的、但被證實是正確且極富成果的結果。怎麼會發生這樣的事呢?數學真的會有創新力嗎?真的能夠通過邏輯處理或計算達到全新的見解——產出多於投入嗎?

如今這個問題特別及時,因為它處於關於機器智能特性的爭論核心——它是否可以發展成一種與人類智慧相媲美的智力,甚至它的終極的極品。

乍一看,反對的論點迫不及待地出現了。

最強有力的論點,至少心理上地來自於反思。仔細考慮我們自己的思維過程,我們不能迴避一個不可動搖的直覺,這個直覺不是專門地甚至主要地包含基於規則的符號處理。確實沒有感到是那種方式。我們通常用圖像和感情思維,而不只是符號。我們的意識流持續地被與外界的相互作用及內部的驅動刺激和重定向,其方式完全不像在效仿數學演算法的展開。

另一論據來自我們用現代數字計算機得到的經歷,因為在一定意義上這些是理想的數學家。它們以遠超過人類可能的嚴格、速度和無錯率,遵循著精確的規則(公理)。在許多專業化的、基本的數學任務中,例如為得到最大利潤安排航空公司的航班計劃或油料配送時間表,它們遠遠超過了人類的作為。然而通常,合理的標準、甚至是最強大的現代計算機依然是脆弱的、有限的,並且真是十足愚蠢的。一個微不足道的程序錯誤、幾行病毒碼或者一個存儲缺陷都可使一台強大的的計算機死機,或使它無法控制地自我毀滅。通訊需要嚴格控制的格式,不支持任何豐富的自然語言。荒謬的輸出可能且經常未被檢測到和未被引起注意而出現。

然而,經過更嚴密的審視,這些論點引發了問題和懷疑。儘管從神經細胞電信號的模式到人類思維過程映射的本質,在很多方面仍是非常神秘的,但人們也了解到不少東西,特別是關於感覺處理的早期階段的東西。至今已發現的東西都不能說明任何比遵從嚴格確立的物理定律的電和化學信號更為奇異的東西被包含了進來。作為一個有效的假設,從電信號的模式到思維模式的映射必須並且確實存在,已被絕大多數的科學家接受。射到我們的視網膜上的光子的模式被拆解,然後解析為基本單位,饋送到一系列令人眼花繚亂的不同的通道,進行處理,然後(以某種方式)重組起來,給我們一個好像簡單的「世界的圖像」,再組合為空間中物體,我們很容易把這些看作是理所當然的。事實是我們一點也不知道我們是如何完成絕大部分我們所做的事情,甚至——也許特別是——我們最基本的頭腦的技能。人們曾試圖造出這樣的機器,它們可以識別圖畫中的物體,或像蹣跚學步的小孩一樣四處走動並探知世界,但這些人非常灰心失望,儘管他們自己可以很容易地做這些事情。他們不可能教給別人他們是如何做這些事情的,因為他們自己也不知道。所以似乎很清楚,反思對思維的深層次結構是一個不可靠的指導,無論是關於已知的還是未知的。

再轉到用計算機的經驗,任何消極的判斷肯定都為時尚早,因為它們在飛速進化。一個近來的基準是深藍計算機在一場短賽中戰勝了偉大的世界象棋冠軍加里·卡斯帕諾夫。如果由人類來做這種表演,任何有判斷力的人都會反對把這個水平上的比賽評價為極富創造性的成就。然而,這種在有限範疇內的成功愈加使問題尖銳化:哪些阻礙純計算創新力在廣闊的領域出現的東西丟失了?在思考這個艱巨的問題時,我相信個案的研究對我們會有幫助。

在現代物理中,也許在整個智力發展的歷史中,沒有一個事件能比狄拉克方程的歷史更好說明極大的數學推理的創新本質。事後,我們知道狄拉克想做的是絕對不可能的。1928年時人們所理解的量子力學規則與狹義相對論不相容。然而就是從這些不相容的假設,狄拉克導出了一個方程,它至今仍是物理學的一塊基石。

這樣,我們在這裡展示了一個具體的、有意義的並且有文獻記載的例子,它介紹了如何對物理世界進行數學推理,並終極於一個具體方程,導致了令思考者自己都大吃一驚的結果。表面上看它違反了一些守恆定律,得到的遠多於投入的。這樣的一個跳躍怎麼可能呢?特別是為什麼狄拉克達到了這一點?當方程把他們引入迷茫時,是什麼使狄拉克和他同時代的科學家堅持墨守於他的方程呢?

深刻的見解來自狄拉克自己的兩段話。在他一篇典型的短文「我作為一名物理學家的生活」中,他特別讚賞他作為一個工程師所受訓練的價值,包括:「工程課程非常強烈地影響了我……我學會了,在描述自然時,必須容忍近似,甚至帶有近似地做工作可能是很有趣的,並且有時是優美的。」沿這條路,狄拉克(以及其他一些人)早期對他的方程的信任使他沒有考慮方程的明顯缺陷,其原因之一就是他可以找到與氫原子光譜的實驗室數據符合得極其出色的方程的近似解。在他最早的論文中,他願意在不談解決的情況下提及困難,即存在數學上顯然同樣有效的其他解,但沒有合理的物理解釋。

沿著表面上看似乎非常不同的路線,狄拉克經常讚賞數學美的啟發能力:

「科研工作者,在他致力於用數學形式來描述自然的基本定律時,應該主要力求數學的美。」

這是早期對狄拉克方程信任的另一個源泉。它曾是(如今也是)異乎尋常的優美。

不幸的是,很難使其精確,並且幾乎不可能傳達給非專業的讀者數學美的本質。但我們可與其他類型的美做一些類比。能使一段音樂、一部小說或一齣戲劇出色的一個特徵是,重要的、充分發展了的主題間的緊張氣氛的積累,然後再以令人驚訝和令人信服的方式解決掉。能使一處建築工程或一座雕塑漂亮的一個特徵是對稱——比例的平衡,有價值的錯綜複雜。狄拉克方程在最大程度上同時擁有了這兩個特徵。回憶一下,狄拉克曾試圖調和電子的量子力學和狹義相對論。可以看到在簡單性和相對論相互衝突的要求間的矛盾是如何被協調的,並且發現基本上只有一個辦法能做到,這是相當漂亮的。那是狄拉克方程數學美的一個方面。另一方面,它的對稱和平衡,幾乎是感官享受。空間和時間、能量和動量,以平等地位出現。系統方程組中不同的項必須按相對論的音樂編舞,0和1(以及i)的模式就在你的眼前跳舞。

當物理的需要導致數學美,或——在少見的並具魔力的時刻——當數學要求導致物理的真理時,各條路線匯聚到了一起。狄拉克曾尋找過一個滿足物理動機的假設的方程。他發現要做到這一點實際上需要一個含有四個組分的方程系統。這太令人驚奇了。最好是具有兩個組分,因為它們清楚地代表著電子自旋的兩個可能方向。而額外的雙重組分開始時並沒有任何令人信服的物理解釋。確實,它們削弱了方程的假定意義。但方程已經呈現出它自己的生命,超越了誕生它的想法,很快正如我們所看到的,這兩個額外的組分就被認為是預示著具有自旋的正電子。

隨著這個匯合,我認為在得到狄拉克方程時,我們抵達了狄拉克方法的核心,這與在得到麥克斯韋方程時抵達了麥克斯韋方法的核心,在得到愛因斯坦方程時抵達了廣義相對論和狹義相對論的方法的核心是一樣的。它們通過實驗邏輯進行。那個概念只是一種表面上的矛盾描述。在實驗邏輯中,人們用方程表述假設,並且用這些方程去做實驗。這就是說,人們試圖從美和自洽性的觀點改進方程,然後檢驗「改進後」的方程是否闡明了自然界的一些特徵。數學家認識到這種「反證法」的技巧:要證明A,你可以假設A的反面,從而得到一個矛盾。實驗邏輯是「成果確認法」:要證明A成立,先假定它成立,然後展示它將導致豐碩的結果。相對於常規的演繹邏輯,實驗邏輯遵從耶穌信條,「請求寬恕比求得允許更受保佑」。確實,如我們已經看到的,實驗邏輯不把不自洽看作是一個不可挽救的災難。如果一種研究路線取得某些成功,而且富有成果,它就不應當因為不自洽或具有近似的本質而被擯棄。相反,我們應該尋求一種方法,使它成為正確的。

記住這些,讓我們回到數學推理的創造性這個問題。前面我說過現代數字計算機在一定意義上是理想的數學家。在任何合理的、精確公理化的數學領域,我們知道怎樣給計算機編程序,這樣它便能系統地證明所有有效的定理。這種現代機器可通過它的程序而高速計算,輸出有效的定理,它比任何人類的數學家所能做到的都快得多,可靠得多。但運行這樣的程序作高深的數學,不會比安排一群眾所周知的猴子去打字,和希望再產生莎士比亞更好。你將會得到許多正確的定理,但基本上它們都是平庸的,而同時有一些寶石毫無希望地埋在了垃圾當中。在實際中,如果你精讀數學或數學物理期刊,不談及文學雜誌,你不會發現太多用計算機提交的工作。試圖教計算機做「真正的」創造性的數學,如同試圖教它們識別真實物體或巡遊真實世界,已經有了有限成功。現在我們看到這些都是密切相關的問題。創造性的數學和物理依賴的不是完美的邏輯,而是一種實驗邏輯。實驗邏輯包括辨認模式、與它們遊戲、提出一些假設去解釋它們,並且——特別是——識別出美。而創造性物理需要得更多:有感知和撫育世界上的模式的能力,並且不僅評價邏輯的自洽性,還評價(近似!)所觀測到的世界的保真性。

那麼,回到中心問題:純數學推理能夠創新嗎?這毫無疑問,如果採用狄拉克的方式,與容忍近似,識別美,及通過與真實世界的相互作用進行學習這樣的能力相呼應,這些因素的每一個都在所有的物理進展的重要進程中扮演了角色。把那些在具體機制中的能力建立在牢固的基礎上,作為一種挑戰,問題就回來了。(全文完)


推薦閱讀:

宇宙,和大自然,有哪些法則,宇宙中的能量是守恆的,怎樣才能充分完美的利用這一法則呢?
Quantum Walk in Graph
Intro-當我們談論物理時,我們在談論什麼
數學與物理的差別
時間,暗能量

TAG:理論物理 | 量子物理 | 物理科普 |