Stephen Wolfram:《一種新科學》15周年回顧
《一種新科學》這本書出版15年了,距離我開始寫它已有超過25年,開始與它相關的工作更是超過35年。每過一年,我都感覺自己更加理解這本書到底是關於什麼的,以及它的重要性。正如書名所暗示的,我寫這本書是想為科學進步添磚加瓦。但隨著歲月流逝,我意識到這本書的核心已經超出了科學領域,蔓延到決定我們整個未來的許多重要領域。
那麼,站在15年後來看,這本書到底在講什麼?它的核心是講一些非常抽象的東西:元理論(the theory of all possible theories)或者元宇宙(the universe of all possible universes)。但對我而言,本書的一大成就是認識到人們可以在程序可實現的計算型宇宙(computational universe)中做實驗,以此探索事物本質。在書的結尾有許多乍一看很奇異的圖片,其實它們只是由非常簡單的程序生成。
在1980年,我是一名理論物理學家,如果那時你問我簡單程序能做什麼,我可能會回答「並不多」。大自然展現出的複雜性深深吸引著我,但像典型的還原論科學家那樣,我認為理解複雜性的關鍵在於搞清楚事物基本成分的詳細特徵。
現在回想起來,命運對我十分眷顧,多年前我恰好擁有興趣和技能去切實探索計算型宇宙中最基本的實驗:系統地排列一套最簡單的程序,並運行它們。
我最初就知道會發生很多有趣的事情,然而很多年以後,我才開始真正體會到我所看到的偉大力量。對我而言,一切都始於一張照片:
或者,它的現代形態:
我稱之為規則30。這是我一直最喜歡的發現,我把它印在自己隨身攜帶的名片上。它是什麼?是我們能想像的最簡單的程序之一。它運行在數排黑白相間的單元格上,從一個黑色單元格開始,然後在下一行重複應用給定規則。關鍵在於,儘管這些規則怎麼看都極其簡單,應用後浮現出的模式並不簡單。
這是計算型宇宙的一個出人意料卻十分關鍵的特徵:即使極其簡單的程序也可能生成非常複雜的行為。我花了整整十年才明白這種現象有多廣泛。它並不僅僅發生在像規則30這樣的元胞自動機上。在人類想像範圍內所有規則或程序中,它基本都會出現。
類似的現象已經出現了幾個世紀,譬如圓周率和素數分布,不過它們基本只被視為個例,其深刻意義尚未得到挖掘。距我第一次看到規則30的現象,已經過去近35年了,每過一年,我就更清楚地了解其中蘊含的深遠意義。
四個世紀以前,木星的衛星及其運轉規律的發現,為現代精密科學和現代科學思維奠定了基礎。那麼規則30能否催生另一次知識革命,進而帶來一種新的思考方式?
從某種意義上來說,我不太喜歡充任引領者(「轉換範式」是個費力不討好的活)。多年來,我只是徑自用這些概念來發展技術和完善構思。但隨著計算和人工智慧逐漸站在世界舞台中心,我認為應當讓更多人理解計算型宇宙蘊藏的巨大價值。
計算型宇宙的含義
以下是我今天看待這個問題的方式。通過觀察木星的衛星,我們提出一個觀點:假如以正確方式看待的話,宇宙是一個有序而規律的地方,而人類終將理解它。但現在,通過探索計算型宇宙,我們很快發現類似規則30這樣的存在,認識到即便極簡規則也能生成不可化約的複雜行為。
《一種新科學》的偉大發明之一是計算等價性原理。第一步是把每個過程(無論它發生在黑白方格、物理世界還是我們大腦中)視為一種將輸入轉為輸出的計算。計算等價性原理表明,在一個極低的閾值上,所有過程都對應著複雜度相同的計算。
當然它也不一定正確。也可能類似規則30的過程要比颶風的流體動力學,或者我在寫作時的大腦運動過程更簡單。而計算等價性原理認為這些事情在計算上是等價的。
這是一個有著深層含義的重要論證。一方面,它暗含著我所說的計算不可化約性(computational irreducibility)。如果有類似規則30的東西正在進行和大腦或者數學一樣複雜的計算,我們不可能『『超過』』它去預測結果,只能通過不可化約的計算,有效跟蹤其每一個步驟,弄清楚它要做什麼。
精密科學中的數學傳統尤其強調通過求解方程來預測系統行為。但是計算不可化約性表明,傳統方法並不適用於分析計算型宇宙,我們只能通過執行明確的計算來模擬系統行為。
觀察世界的角度轉變
在《一種新科學》這本書中,我完成的其中一件事是展示了如何將簡單程序作為一種模型,應用於分析各種物理、生物和其他系統的基本特徵。書籍出版時,不少人對此持懷疑態度。大家都認為嚴肅的科學模型應當建立在數學方程基礎上,這種延續了300多年的學術傳統的確非常牢固。
但在過去的15年里,一些驚人的變化已經發生。今天,無論在動物行為模式領域還是網路瀏覽行為領域,新湧現的模型通常都基於程序而非數學方程。
年復一年,時間緩慢無聲地流逝著。而在這個領域,卻發生了戲劇性轉變。三個世紀以前,數學方程取代了純粹的哲學推理。在短短几年內,程序又取代了數學方程。目前來看,程序是實用而高效的:它做得更好,更有用。
在理解事情發生的基礎時,人們會被引導至類似計算等價性這種想法上去,而非數學理論和微積分。傳統的以數學為基礎的思維方式使得力和動量等概念在我們討論世界時隨處可見。但是現在,當我們從根本上思考計算理論時,必須從不可判定性(undecidability)和計算不可化約性(computational irreducibility)這樣的概念開始。
某種類型的腫瘤會在某種特定模式下停止生長嗎?這或許就是不可判定性。如何預測天氣變化?這或許就是計算不可約性。
這些概念不僅在理解能否對事物建模時大有幫助,而且在弄清楚能否管控事物時也非常重要。在經濟領域,計算不可化約性會制約全球治理方式的發揮空間。在生物領域,計算不可化約性也會抑制普遍療法的可能性,使得推動個性化醫學療法的發展成為必然趨勢。
基於計算等價性等原理,我們能展開討論,究竟為何自然界中複雜行為如此常見。或者,為什麼就連確定性極強的基本規則也會導致計算不可約的行為,雖然從實踐上看這種行為貌似體現了「自由意志」。
深耕計算型宇宙
《一種新科學》的一個中心思想是,計算型宇宙中有著令人難以置信的豐富性。這意味著,存在非常豐富的資源可供我們挖掘利用。
你想自動生成一個有趣的定製藝術品嗎?那就先看看簡單的程序,然後自動選擇一個你喜歡的,正如WolframTones音樂網站十多年前做的那樣。想找到一個最優演算法嗎?只要搜索那些程序足夠多次,就會找到合適的那一個。
通常情況下,我們習慣於付出努力、按部就班地建造事物,比如逐步制定建築計劃,畫工程圖紙或者寫代碼。但是,擁有極易獲得的豐富性的計算型宇宙為我們提供了另一條創作之路:不用嘗試建造任何東西,你只需要給出所要之物的定義,然後在計算型宇宙中搜索即可。
有時候真的挺容易找到。比如,你想生成一個隨機數。那麼,只需要枚舉元胞自動機(就像我在1984年做的那樣),很快就會發現規則30——它是最廣為人知的顯性隨機數生成器之一(例如,看一下單元格值的中心列)。否則,你可能得搜索100000個案例(就像我在尋找邏輯最簡單的公理系統,或者最簡單的通用圖靈機那樣),或者搜索數以百萬甚至萬億的案例。過去25年里,在計算型宇宙中,我們發現了很多新演算法,同時我們也依靠這些演算法來運行Wolfram語言。
某種程度上,這相當引人深思。如果人們在計算型宇宙中發現了一些小程序,那麼就可以說它做了人想做的事。但是,當我們觀察程序運行時,並不了解它背後的運行邏輯。即便可以分析程序的某個部分,並驚嘆於它的「聰慧」,仍舊無法理解整個過程,畢竟這和我們熟悉的思維模式大相徑庭。
當然,我們在使用造物主的傑作時也有過類似體驗。我們可能會發現,某些特定物質是一種有效藥物或強力化學催化劑,卻不清楚其原理。然而,在工程學以及大多數推動現代技術進步的努力中,我們的關注重點通常都放在建構那些設計結構和運轉邏輯比較易於理解的事物上。
曾經,我們以為這就足夠了。但在對計算型宇宙的探索中,我們發現這遠遠不夠:只選擇那些我們易於理解的事物,就會忽略計算型宇宙中的大多數巨大力量和豐富性。
現有技術的世界
當我們從計算型宇宙中挖掘出更多東西時,世界會變成什麼樣?今天我們構建的環境充斥著像簡單形狀和重複過程這樣的東西。但我們越頻繁地利用計算型宇宙,事物看起來就會越不那麼尋常。有時,它們看起來像「有機物」,或者像我們在大自然中看到的東西(畢竟大自然遵循類似的規則)。但有時候它們看起來相當隨機,直到有一天突然不可思議地達到了我們能夠認知到的某種形態。
數千年來,人類作為一種文明,一直在探索周遭的道路上前進——無論是用科學解碼自然,還是用技術創造環境。然而,要想利用計算型宇宙的豐富資源,我們就必須在一定程度上放棄這條道路。
過去人們都認為,和人類創造的工具相比,人類大腦擁有更強大的計算力,因此我們總能「理解」他們。但計算等價性原理表明這是錯的:計算型宇宙中有很多東西和人類大腦或人造工具一樣強大。一旦我們開始使用這些東西,我們就失去了所謂的「護城河(edge)」。
今天我們仍在想像,我們可以識別出程序中那些不相關的漏洞。但在計算型宇宙中,計算不可化約性遍地都是,人們唯一能夠做的只是運行它,看看會發生什麼。
人類本身作為一種生物系統,就是在分子尺度上進行計算的一個絕佳案例,我們身上同樣遍布著計算不可化約性(這就是在一些基本層面藥物難有成效的原因)。我想這是一種權衡:人們可以將技術運算限定在可被理解的層面上。不過,這無疑會錯過計算型宇宙中的諸多豐富性。而我們甚至無法將自身的生物學成就在我們創造的技術中對應起來。
機器學習和神經網路的復興
我注意到,知識領域存在一種普遍現象。在幾十年、甚至幾百年內,知識水平都在緩慢增長,之後由於某種方法論的進步,開始邁入5年左右的「高增長」時期,幾乎每周都有重大成果面世。
非常幸運,我上世紀70年代剛進入粒子物理學研究領域時,正值該領域的飛速發展期。於我而言,上世紀90年代是我個人的一個高產期——《一種新科學》就是這麼來的,事實上這也是我十多年都不捨得離開該領域的原因。
今天飛速發展的領域顯然是機器學習,或者更具體地說是神經網路。我很高興看到這一趨勢。我在1981年就開始研究神經網路,甚至早於我開始使用元胞自動機和發現規則30。但我從沒用神經網路做過任何有趣的研究,我認為它們過於複雜,無助於解決我關心的基本問題。
所以,我把它們簡化後,利用元胞自動機做實驗。(我受到了統計物理中伊辛模型等的啟發,以此類推。)開始時,我認為簡化過度了,小型元胞自動機無法進行有趣的實驗。後來,我發現了規則30。自那以後,我一直試圖深入理解它的含義。
在創建Mathematica(一款科學計算軟體)和Wolfram語言(一種編程語言)時,我經常關注神經網路研究動態,偶爾也會用一些小方法來做一些演算法。大約5年前,我聽到一些讓我驚訝的事:通過訓練神經網路進行複雜運算的想法奏效了。起初我還不確定,後來我們開始嘗試為Wolfram語言增加神經網路運算能力。兩年前我們發布了http://imageidentify.com網站,現在我們已經有了一整套神經網路系統。是的,對此我印象深刻。一些傳統上被視為只有人類才能完成的領域,現在已經可以利用計算機開展常規性工作了。
神經網路究竟是怎樣運轉的?它與大腦無關,只是靈感(儘管實際上它與大腦的工作方式可能多少也有些類似)。一個神經網路實際上是一系列對數組進行運算的函數,每個函數從數組中提取相當多的輸入變數。它和元胞自動機沒有什麼不同。除了一點,那就是元胞自動機通常處理的不是像0.735一樣的任意數字,而是像0和1這樣規則的數字。此外,在元胞自動機中,每個步驟只從一個定義完整的局部區域獲取信息,而不是從所有區域獲取信息。
客觀地說,現在「卷積神經網路(convolutional neural nets)」研究很常見,它的輸入模式和元胞自動機同樣有規律。人們逐漸發現,神經網路的運轉並不依賴精確數字(比如32位),可能只需要幾位數就夠了。
神經網路的一大特徵是,我們知道如何讓它們「學習」。特別是,它們已經從傳統數學中學到了許多功能(比如連續編號),無論提供什麼樣的訓練集,都可以使用類似微積分這樣的方法,使它們通過逐漸改變參數來適配行為。
目前還不清楚,需要多少計算量或者多少訓練範例。但五年前的突破性發現表明,現代 GPU 和網路收集訓練集已經足夠用於解決許多重要的實際問題。
幾乎沒有人會在一個神經網路中最終明確地設置或「編程」得出一些參數。取而代之的是,它們會自動設定合適的參數。但不同於元胞自動機等簡單程序(它們通常窮舉所有可能性),神經網路有一種基於微積分的漸進過程,這會逐漸完善網路,類似於生物進化過程中逐步提高有機體「健康」的過程。
這種訓練神經網路的方式效果顯著,不過人們也很難理解其內在規律。但從某種意義上說,神經網路依舊大致遵循計算型宇宙的規律:它基本上保持相同的計算結構,並且通過改變參數來改變其行為。
於我而言,神經網路的成功是對計算型宇宙理論闡釋力的認可,也是對《一種新科學》思想的另一種印證。因為它表明,在計算型宇宙中,只要擺脫詳細行為能被預測的確定性系統的束縛,馬上就能發現各式各樣的豐富性和有用的東西。
符合現代機器學習理論的《一種新科學》
是否能在神經網路分析中用上計算型宇宙的全部力量和《一種新科學》的思想?對此,我表示懷疑。實際上,隨著對細節的認知愈發清晰,我認為對計算型宇宙的探索將進入高速增長期:進入一個前所未有的繁榮時期。
在當前的神經網路研究中,存在一種明顯的權衡。在神經網路內部,與簡單函數(包含基本參數)相似的部分越多,就越容易用微積分的思路來訓練網路。但是,神經網路與離散程序或者結構可變的計算越相似,其訓練難度就越高。
值得一提的是,我們現在經常訓練的網路在幾年前來看是完全做不到的。正是這些數千萬億次的 GPU 高效運算才使得訓練可行。即使在增量數值方法不可能到達的領域,有人用非常常見的技術(就比如說,本地全局搜索)做重要的訓練,我也不會太驚訝。甚至有可能發明像微積分一樣的主要歸納法,並運用在整個計算型宇宙中。(不過,基於對元胞自動機規則空間等事物的幾何基本概念的概括性認識,我仍保有一些懷疑。)
人們能利用它做什麼?或許會發現能實現特定計算目標的更簡單的系統,也可能誕生超出我們目前可實現的(比如人類大腦範疇)的全新運算層次。
近期,有個關於建模的趣事。隨著神經網路越來越成功,人們開始疑惑:當我們可以為神經網路的結果構建一個黑盒模型時,為什麼還要費心模擬系統內部運轉過程?如果我們設法讓機器學習深入計算型宇宙中,我們就不必再費勁權衡了,它們已經能夠學習其模型機制和結果。
我敢肯定,將完整的計算型宇宙引入機器學習範疇,將會帶來驚人的後果。值得一提的是,計算普遍性和計算等價性原則會弱化它的原理性。因為這兩個特性表明,即使目前通用型的神經網路也能模仿任何其他系統的功能。(事實上,1943年誕生的現代神經網路思想帶來了這種普適性。)
作為一個實用性問題,當前的神經網路早期是建立在硬體上等事實,會使它們成為現行技術系統所需要的基礎,即便它們遠遠不算最優解。我的猜測是,在可預見的未來,讓有些程序可以訪問完整的計算型宇宙是很有必要的,這也使得它們更加實用。
發現人工智慧
實現人工智慧需要怎樣的條件?兒時,我喜歡研究如何讓計算機知曉事物,並且能夠回答它已知的問題。在我 1981 年學習神經網路時,這項興趣也部分包含在我當時的所做的——試圖理解怎樣構建這樣一個系統之內。碰巧,我那時剛剛開發了 SMP(一款數學軟體),它是 Mathematica 的前身(最後演化為Wolfram語言),並且主要基於符號模式匹配(「假如看到A,則將A轉換為B」)。當時,我想像人工智慧是某種「更高層次的計算」,但是不知道如何實現它。
我時常思考這個問題,卻一直沒能解決。然而,當創作《一種新的科學》時,我突然想到:如果我真的相信計算等價性原理,那就不存在任何所謂「更高水平的計算」,因此人工智慧必須依據現有水平的計算知識來實現。
正是這個認識讓我著手開發 Wolfram|Alpha(一個「計算知識引擎」)。我發現,很多像自然語言處理這樣「人工智慧導向的東西」,只需「普通計算」就能完成,壓根用不到任何神奇的新型人工智慧發明。客觀地說,事實的一部分就是:現在我們已經在使用《一種新科學》中的思想和方法:我們不僅僅在將所有事物程序化,而且常常在計算型宇宙中搜索規則和演算法來使用。
那麼能否普遍運用人工智慧?基於目前所掌握的工具和知識,我們的確可以將我們可以定義的任何事物自動化。但問題在於,下定義是一件比我們想像中更困難、更核心的事。
我看待這一點的方式是,有很多已經很接近計算型宇宙的運算。它們是很強大的,可以和人類大腦相媲美。不過,除非它與人類的目標和動機相結合,否則我們便不認為這是一種「智力」。
自從開始寫作《一種新科學》,我一直喜歡引用格言「天氣有自己的想法」。這聽起來像一種萬物有靈論和先知論。不過計算等價性原理表明,根據多數現代科學理論來看,這種說法是正確的:氣象流體力學和人類大腦中的電傳導在計算複雜度上是相同的。
但是,它是「智能」的嗎?當我和人們談論《一種新科學》和人工智慧時,我經常被問到何時能讓機器誕生「意識」的問題。生命、智能、意識:它們都是人類在地球環境下提出的特定概念。那麼,在普遍意義上它們究竟是什麼?所有地球生命都有核糖核酸(RNA)和細胞膜。但這僅僅是因為我們所知的生命都是相關聯的歷史分支的一部分,並不意味著這些細節正是生命概念的根本要素。
智能也是如此。我們只有一個有足夠說服力的例子:人類。(對動物我們都無法肯定。)但我們所經歷的人類智能與人類文明、人類文化和生理結構都有著深刻的關聯,儘管這些都和智能的抽象定義毫無關聯。
我們也可能會想到外星智能。雖然計算等價性原理暗示我們周圍其實存在「外星智能」,但它與人類智能並不完全一致。譬如,規則30就像人類大腦一樣進行著複雜計算,但它對於自己正在計算的東西的意義似乎並不明確。
我們想像,人類行動總是包含特定目標和動機,而規則30隻是按照限定規則在運轉。不過,我們終將意識到,兩者之間的差異並不大。畢竟,人類大腦同樣被自然規律所支配著,某種程度上我們的行為也只是在遵循那些規則。
任何過程都可以用機械原理來描述(「石頭遵循牛頓定律運動」),也可以用目標論來描述(「石頭正在移動以最小化潛在能量」)。基於機械原理的描述在和科學產生關聯時最有用,而基於目標論的描述在和人類智能產生關聯時最有用。
這對於思考人工智慧至關重要。我們可以構建出與任何事物複雜程度相當的計算系統,但我們能讓它們去做符合人類目標和動機的事情嗎?
從某種意義上說,這是人工智慧的關鍵問題:重要的不是實現底層的複雜計算,而是如何從計算中實現我們想要的溝通。
語言的重要性
我一生大部分時間從事的是一名編程語言設計師的工作,其中最重要的成果就是創造了 Wolfram語言。我一直將自己視作一個語言設計師,首先想像人們想進行什麼樣的計算,然後像簡化論科學家一樣,找到能用於建立計算的優質原語。但不知為何,在寫作《一種新科學》和思考人工智慧的過程中,我的思維方式逐漸改變。
現在,我認為自己正在人類思維模式和計算型宇宙的潛能之間架設一座橋樑。原則上,計算可以實現各種各樣令人驚奇的事。編程語言,就是人類表達需求或目標,並儘可能使其實現自動化運轉的一種方式。
編程語言設計必須從我們了解和熟知的內容開始。在 Wolfram 語言中,我們用英語單詞命名內置原語(built-in primitives),利用這些單詞已有的含義來引申。Wolfram語言與自然語言不同,它更加結構化,更加強大。它是基於人類共享的知識語料庫,建立於我們熟知的辭彙和概念之上。它給我們提供了一種建立任意複雜程序的途徑,以便能有效指向任意複雜的目標。
計算型宇宙能做很偉大的事,但這些事未必都是我們人類能描述或與之產生聯繫的。但是,在構建 Wolfram語言的過程中,我的目標是盡最大努力挖掘人類所需的一切,並用可執行的計算術語來表達它。
當我們在觀察計算型宇宙時,很容易被已有的表達方式或思維框架所局限。現代神經網路提供了一個有趣的例子。為了開發 Wolfram語言的圖像識別功能,我們訓練神經網路識別了上千種事物。為了滿足人類的需求,神經網路最終得用可以被語言命名的概念來描述它看到的東西,譬如桌子、椅子、大象等等。
然而在神經網路內部隱含的操作邏輯是識別世界上任何物體的一系列特徵。它是綠色的嗎?它是圓的嗎?等等。經過訓練後,神經網路能鑒別出有助於分辨事物差異性的特徵。問題在於,這些特徵幾乎都沒有用人類語言指定過。
在計算型宇宙中,可以找到描述事物的絕佳方法,我們對此卻十分陌生。基於人類文明的現有知識庫,我們還無法表述他們。
當然,當前人類知識庫也在不斷添加新概念。一個世紀以前,人們還無法描述嵌套模式(nested pattern),而現在我們只用說「它是一個分形(fractal)」。關鍵在於,在計算型宇宙中,「潛在有用的概念」是無窮盡的,我們永遠也不可能跟上它的步伐。
數學中的隱喻
寫作《一種新科學》時,我把它視為打破數學的應用——至少是作為科學的基礎的一種努力。不過,我意識到的事情之一就是,純數學本身也對書中思想產生了很大影響。
什麼是數學?它是一門基於數字、幾何等來研究確定的抽象系統的學科。從某種意義上看,它探索的是所有潛在抽象系統組成的計算型宇宙的一小部分。但也不能否認數學對人類知識領域的巨大貢獻:事實上,大約300萬個已知的數學定理也許是人類構建的最大的體系性智力結構。
自歐幾里得以來,人們至少在理論上認為數學先從某些公理(比如,a+b=b+a,a+0=a,等等)開始,然後再構建定理推導過程。數學為什麼難?根源在於計算不可化約性現象,顯而易見,我們無法簡化定理的推導步驟。換句話說,數學得到的結果可能是任意的。更糟的是,正如哥德爾不完全性定理(G?del』s Theorem)所論證的那樣,數學已經證明某些系統內存在既不能證明也不能證偽的命題。這種情況被稱為「不可判定性(undecidable)」。
從某種意義上說,數學之偉大就在於可以有用地去證明它。畢竟多數我們關注的數學結果都與不可判定性相關。那為何這種不可判定性不出現呢?
事實上,如果人們考慮隨機抽象系統(arbitrary abstract systems),它出現得很多。以典型的元胞自動機或圖靈機器為例,詢問系統,是否無論其初始狀態如何,均停止在周期性行為上。就連如此簡單的事物,往往都呈現出不可判定性 。
為什麼數學中不會出現這種情況?也許數學公理有其特殊之處。當然,假如有人認為數學是唯一描述科學和世界的工具,也許是出於某種特定原因。但本書主旨認為,計算型宇宙中有一整套潛在規則,可以用於科學研究和描述世界。
事實上,我並不認為數學傳統中所使用的公理有任何普適意義:它們只是歷史的偶然產物。
人們發明的數學定理又是怎樣的?我認為它們同樣是歷史產物。除了最微小的區域之外,數學海洋中充滿了不可判定性。但不知何故,數學偏愛挑選可以證實定理的島嶼,並且為自己處於靠近需耗費巨大努力方可證明的不可判定性之海的地方而自豪。
我對數學中已公布的定理的網路結構很感興趣(這是一種有待整理的東西,像歷史上的戰爭或化學物質的特性)。我很好奇,數學成果中是否存在固定序列,或者從某種意義上說,隨機部分是被人為挑選出來的。
我認為,有相當多的類比可以用於理解我們之前討論的關於語言的問題。什麼是論證?基本上是一種向某人解釋為何某事為實的途徑。我已經做了各式各樣的自動化論證,其間有成百上千個步驟,每個環節都能用計算機加以驗證。但是,就好比一個神經網路的內部構造,這怎麼看都很奇怪,人類難以理解。
如果一個人想要理解它,必須熟悉「概念性節點」(conceptual waypoints)。這更像是語言體系中的辭彙。如果論證的某個特定部分有一個名稱(如「史密斯定理」),並且擁有公認的含義,那麼它對我們就是有用的。但如果這是一個無差別的計算組塊,對我們而言就沒有任何意義。
任何公理系統都包含一系列無窮可能的定理。哪一個是「有趣的」?這真是個獨屬於人類的問題。基本上,它們最終都會成為「有故事的定理」。我在這本書中指出,從符合基本邏輯的簡單案例來看,歷史上被視為有趣的命名定理在某種意義上恰恰是最微不足道的。
我猜測,對於更豐富的公理系統,「有趣」的東西必須來源於已經被視為有趣的事物。這就像建構一個單詞或概念:除非將其與現有概念相聯繫,否則無法引入新概念。
近年來,我特別好奇像數學這樣一個領域,究竟固步自封、缺乏進步到了何種程度。是否只能有一條歷史演進路徑——從算術到代數再到現代數學的更高成就?還是有無數種多樣化的可能性,可以造就完全不同的數學史呢?
某種意義上,答案取決於「元數學空間的結構(structure of metamathematical space)」:也就是遠離不可判定性汪洋大海的真實定理網路是什麼?也許對不同的數學領域而言有一些差別,有些領域(認為數學是「被發現的」)會比其他領域(認為數學具有隨機性,且數學可被「發明」)更「固步自封(inexorable)」。
但對我來說,最有趣的事情莫過於,當我們看待這些術語時,關於自然與數學特性的問題,最終和自然與人工智慧的特性的問題是多麼近似。正是這種共性使我意識到,《一種新科學》的想法是多麼強大和普遍。
科學何時出現?
傳統數學方法在物理學和天文學等科學領域的確發揮了重要作用,但在其它一些領域,如生物學、社會科學和語言學等卻用途不大。長期以來,我一直堅信,要在這些領域中取得進展,必須要拓展目前使用的各種模型,站在更宏觀的計算型宇宙中考慮問題。
的確,過去15年間,這種做法也逐漸取了一些成功。比如,有許多生物和社會系統都在使用由簡單程序構建的模型。
不同於呈現為「可解決狀態」的數學模型,進行精確模擬後,計算模型通常呈現出計算不可化約性。這可以成功做出特定預測或應用於技術模型。但這有點像數學定理的自動化論證,人們可能會問:「這真的是科學嗎?」
是,人們可以模擬系統行為,但是否能「理解」它呢?在某種意義上,計算不可化約性意味著人們並不總是能夠「理解」事物。在計算模型中,可能沒有有用的「故事」可講,也可能沒有「概念性節點」,只有大量的詳細計算。
想像一下,某人正在努力研究大腦如何理解語言——這是語言學的一大目標。也許我們會得到一個精確模型,發現一些決定神經元放電或低水平大腦表現的精確規律。然後我們來看看,在理解整個句集時產生的特定模式。
如果這些模式看起來像規則30的行為呢?或者像循環神經網路的內部結構?我們能講一個發生了什麼的故事嗎?要做到這一點,就必須創建某種更高級的符號表示法:在這裡有效產生了能表示事件的核心元素的辭彙。
然而,計算不可化約性意味著可能沒法創造這些東西。雖然它總能發現一個計算可歸約性(computational reducibility),從而使人們可以陳述一些東西。但不會存在一個完整的故事。可能有人會說,這些可歸約的科學事實沒用。不過,這只是當人們使用(如標題所述)《一種新科學》時會碰到的麻煩之一。
控制人工智慧
近年來人們很擔心人工智慧。他們想知道,當人工智慧「比人類更聰明」時會發生什麼。計算等價性原理帶來一個好消息:從基本層面來說,人工智慧永遠不會「更聰明」——它們只能進行和人類大腦層次相當的運算,這和簡單程序在做的事一樣。
當然從實際來講,和人類大腦相比,人工智慧確實可以更快地處理大量數據。我們也會讓它們替人類處理許多事物,比如從醫療設備到中央銀行再到運輸系統等。
那麼重要的是,我們該如何指導它們做事。一旦我們開始真正應用計算型宇宙,就不可能給人工智慧「手把手式」的教導。而是我們只需要為人工智慧設定目標,讓它們自己找出實現這些目標的最佳路徑。
從某種意義上說,我們已經用Wolfram語言這樣做很多年了。有一些用來描述任務(諸如畫圖、數據分類等)的高級功能,之後編程語言會自動尋找最優解完成任務。
最終,真正的難題是找到一種描述目標的方法。比如,你想尋找一個元胞自動機,用於製作「漂亮的地毯圖案」或者「好的邊緣檢測器」,但這些東西究竟意味著什麼?你需要的是一種能幫人類儘可能準確傳遞其意圖的語言。
這和我之前談過的問題差不多。人們必須找到一種可以相互間討論我們關心的事的方式。計算型宇宙中有無限多的細節。但是通過人類文明和共通的文化歷史,我們可以找出一些重要概念,並用它們來表述目標。
三百年前,像萊布尼茨這樣的人熱衷於尋找一種精確的象徵性方式來呈現人類思想和人類話語。他太超前了。直到現在,我們才勝任這項任務。事實上,我們花了很長時間才讓Wolfram語言能夠描述真實的世界。我希望能建立一個完整的「象徵話語體系」,幫助我們談論我們關注的事。
今天,我們只是用比日常用語更精確一點的法律術語撰寫法律合同。但是用象徵語言,我們可以撰寫真正的「智能合約(smart contracts)」,用高級術語描述我們的目標,隨後機器便可以自動驗證或執行合約。
那人工智慧呢?我們要告訴它們,我們希望它們做什麼。我們需要和它們簽訂合約,或許還得為它們制定章程。這些文件都建立在某種象徵語言之上,它既允許我們表達目標,也能交由人工智慧執行。
關於人工智慧章程應該包含什麼,以及如何構建它,從而反映世界政治和文化景觀,有很多值得探討之處。其中一個顯而易見的問題是:人工智慧章程能會像阿西莫夫的機器人三定律那樣簡單嗎?
《一種新科學》中蘊藏著答案:不可能。從某種意義上說,章程是一個描述世界的可能性與不可能性的嘗試。然而計算不可化約性表明,這需要收集無窮多的分析案例。
我覺得這很有趣,計算不可化約性等理論最終和一些很實際且核心的社會問題相衝突。一切都始於對理論可能性的理論探索,最終卻演變為社會上每個人都要關心的問題。
無窮盡的前沿
我們會達到科學的終點嗎?我們——或者人工智慧——最終會發明出一切需要發明的東西嗎?
對於數學,很容易發現我們能構造出無窮個定理。對於科學,也有無數詳細問題要問。同時,還有無數發明等待我們去創造。
但問題在於:有趣的新事物總會一直存在嗎?
計算不可化約性表示,通過對舊事物進行大量不可化約的計算後,總會發現新事物。因而從某種意義上說,我們總會發現「驚喜」,但並不會從舊事物中立即浮現出來。
它只是像不同形狀的怪岩一樣無窮無盡?還是會出現一些人類認為有趣的新特徵?
又回到了我們曾遇到過數次的問題:對人類而言,我們必須基於可用于思考某個事物的概念框架來發現有趣的事物。的確,我們可以在元胞自動機中找到一個「永久結構」,然後開始談論「結構間的碰撞」。但當我們看到一堆亂七八糟的東西時,除非用更高層次的象徵性的方式來談論它,否則並不會感到「有趣」。
從某種意義上說,「發現有趣」的速度不會受到人類進入計算型宇宙和發現事物能力的限制。相反,它將被人類為發現的新事物建構概念框架的能力所制約。
這類似於《一種新科學》形成過程中正在發生的事。人們看到這些(http://www.wolframscience.com/nks/p42–why-these-discoveries-were-not-made-before/)(素數分布、圓周率位數等)。但如果沒有相應的概念框架,它們看起來並不「有趣」,也不會存在以它們為核心建構的事物。事實上,當我更加了解計算型宇宙——甚至是我很久以前看到的東西——我逐漸建立起支撐我走得更遠的概念框架。
此外,需要指出發明(inventions)與發現(discoveries)有一定差別。人們在計算型宇宙中看到一些新東西,這是一種發現,而如何利用計算型宇宙實現某種目標才是一項發明。
而且像專利法一樣,如果你只說「看,這就行了」,那算不上真正的發明。你必須以某種方式理解它達成的目標。
在過去,發明過程的重點往往是讓某個東西開始工作(發明讓燈泡亮的燈絲等等)。但在計算型宇宙中,重點轉移到了發明目的上來。因為一旦你描述了目標,就可以自動化地找到一種實現路徑。
這並不意味著它總是很容易。事實上,計算不可化約性意味著它相當困難。比如,你知道某些化學物質相互作用的精確規律。你能找到一種化學合成路徑,進而發現某種特定的化學結構嗎?可能有一種方式,但計算不可化約性同時表明,我們可能無法弄明白這條路究竟有多長。如果還沒找到,那你可能永遠也無法確定究竟是因為不存在,還是因為尚未找到。
物理學基本原理
如果一個人想探索科學的邊界,他估計會懷疑物理學的基本理論。考慮到我們在計算型宇宙中看到的一切,物理世界是否和計算型宇宙中的某個程序存在對應關係?
當然,除非找到它,否則我們便無法真正了解它。但自從《一種新科學》出現後,我對這種可能性越來越樂觀。
無疑這將是物理學的一大變化。如今,有兩個主流基本物理框架:廣義相對論和量子場論。廣義相對論提出已經超過100年了,而量子場論估計也超過90年了。它們都取得了巨大的成就,但都未能提供一個完整的物理學基本理論。我想,現在已經是時候邁出新步伐了。
但還有一件事:在探索計算型宇宙的過程中,即使基於非常簡單的模型,我們也會迸發出大量關於可能性的靈感。我們可能認為,物理學的豐富性必須基於一些非常複雜的基礎模型。但目前來看,即使是非常簡單的底層模型也能很好地生成複雜性。
底層模型可能是什麼樣的?我不打算展開討論很多細節,只想強調一點,底層模型應該儘可能少地嵌套。我們不能自大地認為已經理解了宇宙構造;我們應該使用儘可能非結構化的通用模型,按照計算型宇宙的邏輯去運行:搜索一個能實現任務目標的程序。
我最喜歡的非結構化模型是網路:它只是一個鏈接節點的集合。它們完全有可能形成一些類似代數結構的模型,也可能形成一些其他的東西,但都可以被視作一種網路。按照我的設想,它是一種時空表層之下的網路:我們已知的時空表徵都必須從該網路的實際行為中顯現出來。
過去的十年里,人們越來越關注循環量子引力(loop quantum gravity)和自旋網路(spin networks)。它們和我一直在做的事一樣,都涉及到網路,也許兩者間還有更深的關聯。但在通常的表述中,他們更像是一種數學式的複雜。
從傳統物理學方法的角度來看,這是個好主意。但是,基於從研究計算型宇宙而來的直覺,而且將其應用於科學和技術,似乎就完全沒必要。的確,我們尚未徹底理解物理學的基本理論,但可以理解最簡單的假設。它和我研究過的簡單網路特別相似。
一開始,對經過傳統理論物理訓練的人(包括我自己)來說,這顯得很陌生。不過,還是有一些東西並非那麼陌生。大約20年前,我有一個大發現(至今還未被廣泛接受),當你看到一種我研究過的巨型網路時,你可以證明它的平均行為遵循愛因斯坦重力方程(Einstein』s equations for gravity)。換句話說,即使不在基礎模型中置入任何精緻的物理定律,它也會自動出現。這個發現特別讓人激動。
人們對量子力學提出了很多問題。的確,我的基本模型並未建立在量子力學上(正如它不建立在廣義相對論上一樣)。目前要確定「量子力學」的本質比較困難,不過也有一些潛在跡象表明,我的簡單網路最終表現出了量子行為——就像我們所熟知的物理學一樣。
假如,由無數可能的程序構成的計算型宇宙中存在基礎物理理論,那我們該如何尋找呢?顯然,應該從最簡單的程序開始搜索。
在過去的15年里,我一直在做這件事,雖然頻率低於我的預期。到目前為止,我的主要發現是,很容易找到那些並非顯然不屬於我們宇宙的程序。有很多程序的時空表徵與我們這個宇宙差異很大,或者還表現出其他異常。但事實證明,找到並非明顯不屬於我們這個宇宙的替代宇宙並不困難。
但計算不可化約性給我們出了個難題。我們可以通過數十億個步驟模擬替代宇宙,但並不清楚它會朝什麼方向演變,是否會成長為我們這樣的宇宙,或者完全不同。
我們不太可能僅僅通過宇宙初始時的片段狀態,就能發現任何熟悉的東西,比如說光子。因此,我們很難構造一種描述性的理論或者強有力的物理學。但從某種意義上說,這和我們在神經網路等系統中面臨的問題出奇地類似:那裡有計算過程,但我們是否能識別出「概念性節點」,並從而建構一個可以理解的理論?
我們的宇宙是否必須在那個層面上可被理解這個問題我們並不清楚,而且我們可能在很長一段時間裡都處於一種奇特狀態中,自認為在計算型宇宙中發現了人類宇宙,卻又不敢肯定。
當然,我們也許足夠幸運,推演出了一個有效的物理系統,並通過我們發現的小程序重建整個宇宙。這是個非凡的科學時刻,但又會引發一系列新問題,比如為何是這一個宇宙,而非另一個?
裝有一兆個靈魂的盒子
現在,我們人類是以一種生物系統的形式存在的。但在未來,肯定會在技術上以一種數字或者說計算型的形態再現人類大腦的所有過程。因此,只要這些過程能代表人類,就可以在所有計算層面上實現人類的「虛擬化(virtualized)」。我們可以想像,這樣發展下去,未來整個文明形態可能會演變成「裝有一兆個靈魂的盒子(box of a trillion souls)」。
盒子裡面會以各種計算形式,展現那些「虛擬靈魂」的思想和經歷。這些計算反映著宏偉的人類文明,以及我們的一切經歷。但在某種程度上,它們並不算多麼特殊。
也許會讓人類有點失望,畢竟計算等價性原理已經表明,這些計算並未呈現出比其他系統更複雜的計算性——即使與簡單計算相比也是如此——同時也沒有呈現出複雜恢弘的文明歷史。的確,細節蘊含所有歷史。但從某種意義上說,不知道尋找何物或關心何物,你就不能說它有什麼特殊之處。
好吧,但是「靈魂」本身呢?人們是否可以通過觀察他們實現的特定意圖來理解其行為?在目前的生物形態中,人類有各種各樣的限制和特徵,它們賦予我們目標和意義。但在虛擬的「上傳」形態中,大多數都會消失。
我曾經思考過,在這種情形下,「人類」的意圖會如何演化。當然,在虛擬化形態下,人類和人工智慧之間差異不大。未來也可能會讓我們失望,「虛擬靈魂」的未來文明為了消磨永恆時光而陷入「玩遊戲」效應的陷阱。
我逐漸認識到,用我們目前對目標和意義的認識來理解未來是行不通的。想像一下,回到一千年前,給古人解釋未來的人們每天都在跑步機上行走,或不斷地給朋友發照片。關鍵在於,除非相應的文化框架已經形成,否則這些活動便沒有意義。
當我們試圖描述什麼是有趣的或可解釋的時,會再次發現這些都依賴於一整套「概念性節點」網路的發展。
我們能想像100年後數學的模樣嗎?它建立在我們不知道的概念上。同理,未來人類的動機也依賴於某些未知的概念。站在今天的人類視角,我們能做出的最好描述,或許是那些「虛擬靈魂」只是在「玩遊戲」而已。但是對於未來人類而言,可能存在一整套微妙的動機結構,讓他們能通過回溯歷史文化發展的每一步來理解。
此外,如果我們了解物理學基本理論,隨後完成虛擬化,那麼至少在原則上:我們可以模擬「虛擬靈魂」宇宙的運轉。如果這樣可行,那就沒什麼理由必須對人類宇宙進行模擬,它可以模擬計算型宇宙中的任何宇宙。
正如我提到的,即使在任何宇宙中,也永遠不會出現「事情都做完了」和「沒什麼可發現的了」這樣的情況。但我有一些奇思妙想,那些「虛擬靈魂」不會滿足於只存在於人類物理宇宙的模擬版本中,可能更樂於(無論這對他們意味著什麼)走出牢籠,去探索更廣闊的計算型宇宙。因而從某種意義上說,人類未來將是一個無窮盡的探索之旅,而這一切無疑會出現在《一種新的科學》所討論的語境中。
計算型宇宙的經濟學
很久以前,我們就被迫思考「虛擬靈魂」的問題。我們面臨著一種窘境,在人工智慧完成大部分勞動的世界裡,人類應該做什麼。從某種意義上說,這個問題並不新鮮:它只是科技和自動化發展的延伸。但不知為何,這次感覺非同尋常。
我認為原因在於,計算型宇宙中有那麼多豐富、易得的事物。我們可以打造一台能自動完成任務的機器。我們甚至可以建造一台通用計算機,通過編程來完成多樣化任務。然而,即使這些自動化程序拓展了人類行動的界限,人類仍舊得在其中投入許多精力。
現在不一樣了,我們只要明確任務目標,剩下一切都會自動完成。各種各樣的計算(也就是所謂的「思考」)可能即使沒有人類的介入也會持續進行。
乍看之下,似乎不太對勁。未經耕耘,怎能豐收?這有點像問大自然是如何自身擁有複雜性的。要知道,我們耗費巨大精力製造的物品,本身也並不太複雜。我認為,答案是它正在對計算型宇宙進行挖掘。對我們而言亦是同理:通過挖掘計算型宇宙的潛能,我們基本上達到了無限的自動化水平。
當今世界上的許多重要資源仍然依賴於物質材料,這些材料通常從地球中開採出來。當然,一些地理和地質上的偶然性決定了合適的開採人員和開採地點。此外,可供開採的資源數量也是有限的。
然而,計算型宇宙的資源卻是取之不盡用之不竭的,任何人都可以開採。在開採方面雖然存在一些技術性問題,不過也有一大堆優秀的開採技術。計算型宇宙擁有面向全球的無限資源,不存在稀缺性,更不「昂貴」。
計算思維之路
上個世紀最偉大的智力轉變,或許是計算思維方式的出現。我常說,從考古學到動物學的範疇內,只要一個人在其中任選一個「X」領域,那麼「計算型X」領域也將馬上或很快出現,而這些「X」領域必將代表各自學科的發展方向。
我一直在努力嘗試發現這樣的計算領域,開發Wolfram語言便是一例。不過,我對元問題也很感興趣:應該如何傳授抽象的計算思維,比如教給孩子們?作為一種實用工具,Wolfram語言無疑非常重要,但其概念、理論和基礎又是怎樣的?
這就是《一種新科學》誕生的緣由。它主要討論純粹抽象的計算現象,而非在特定領域或任務中的應用。這有點像初等數學:只是通過引入數學思維來促進教學和理解,無關具體應用形式。《一種新科學》的核心也是如此。我們需要知道,看重直覺和引入計算思維模式的計算型宇宙與具體的應用程序無關。
人們可以把它看作是一種「前計算機科學(pre computer science)」或「前計算型X(pre computational X)」,在討論計算過程的具體細節之前,人們可以只研究計算型宇宙中簡單而純粹的事物。
確實,在孩子學會算術之前,他們也完全可以做一些像元胞自動機填色卡片書之類的東西,自己執行或者在計算機上運行一些簡單程序。這能教會他們什麼嗎?其實,它教導孩子們學會為事物定義規則或設計演算法,讓他們知道使用它們會帶來一些有用且有趣的結果。同時,它讓像元胞自動機這樣的系統生成一種視覺模式,比如,人們甚至可以在自然界中找到這些原型(就像軟體動物的殼)。
隨著世界更加計算化——更多事情可以被人工智慧和對計算型宇宙的挖掘完成——不僅理解計算思維變得極具價值,在探索計算型宇宙中養成的直覺也變得非常重要。在某種意義上,這種直覺是《一種新科學》的根基。
還有什麼要弄清楚的?
在寫作《一種新科學》的10年時間裡,我的目標是儘可能回答所有關於計算型宇宙的「顯著性問題」。站在15年後回顧,我自認為做的不錯。事實上,如今在考慮該用計算型宇宙做些什麼時,我發現自己很可能已經在書或者筆記里談論過了。
過去15年中最大的變化之一,是我逐漸更深入地了解了這本書的意義。書中有許多具體的概念和創見。但從長遠來看,我認為最重要的是,它們作為應用和概念的根基,如何幫助人們理解和探索一系列新事物。
但即使在計算型宇宙的基礎科學方面,人們仍然希望獲得一些具體的結果。比如,試圖發現更多證據來證實或證偽計算等價性原理及其適用性。
像大多數科學一般原理一樣,計算等價性原理的認識論地位比較複雜。它是一個可被證明的數學定理嗎?它是宇宙的自然法則嗎?或者說它是一種對計算概念的定義?或許可以說,它更像熱力學第二定律或自然選擇學說,是這些的結合。
但有一點很重要,那就是發現具體的證據來證明(或證偽)計算等價性原理。該原理表明,即便簡單規則系統也應能進行任意複雜的運算,因而它們也可以充當通用計算機。
事實上,這本書的主要結論發現,該原理也適用於最簡單的元胞自動機(規則110)。該書出版五年後,我決定為另一項證據設立獎項:能想到的最簡單的通用圖靈機(universal Turing machine)。我很高興短短几個月內就有人獲獎,圖靈機被證明是通用的,此外還發現了一些證實計算等價性原理的證據。
在推進《一種新科學》的應用上還有很多事要做。比如,有待建立的適用於各種系統的模型,有待發現的技術,有待創造的藝術,要理解這些含義還有許多工作要做。
但很重要的是,不要忘記對計算型宇宙進行純粹理論研究。以數學類比的話,應用數學值得追求,「純粹數學(pure mathematics)」同樣有探索的巨大價值。計算型宇宙也是如此:需要探索很多抽象層次的問題。正如書名所暗示的,現在已經可以定義一門新學科了:一門純粹的計算型宇宙科學。我認為《一種新科學》的核心成就開啟了一門新學科,我將其視為自己的最大成就。
A New Kind of Science: A 15-Year View翻譯:自天然;校對:tangcubibi;編輯:EONn關注公眾號neureality,第一時間閱讀深度譯文。n
推薦閱讀:
※LLHelper人種鑒定器演算法解析
※羅素的數學成就有哪些?
※南京大學程崇慶教授解決Arnold擴散的文章在頂級期刊發表
※「奇點」的「奇」怎麼讀?