像海參一樣愚蠢 ——人工智慧與智能計算縱橫談
06-18
IT產業的列車被一前一後兩個火車頭驅動:人們生產生活的需求在後面推進,計算科學和技術的進展在前面牽引。我們在關心IT產品、IT市場和IT應用的同時,也希望參觀一下IT技術的幕後——眾多從事計算科學和技術基礎研究的機構。在那裡,我們可以和研究者交談,跟上他們的思想節拍,尋找藏在深山中的絢麗景觀。 在這個新奇之旅的第一站,我們要接觸到一些人工智慧及智能計算方面的專家,包括三點陣圖靈獎的獲得者。他們都是通過微軟公司的學術活動與我們見面的,大部分屬於該公司分散在世界各地的數家研究院。他們與別的人工智慧及智能計算研究者一道,向世界展示了這個領域的新境界。 喂,你是人嗎? 徐迎慶研究員想到一個可以哄媽媽開心的辦法。老人退休在家,喜歡和兒子聊天,但兒子很忙,忙得恨不得用一截圓木代替枕頭。如果計算機可以代替人聊天就好了。徐迎慶的辦法是,兩邊都開著攝像頭說話,首先和媽媽說幾分鐘,兒子這邊的計算機用這幾分鐘時間生成了兒子的形象,並且了解了談話的大致內容。幾分鐘後,按一個鍵,計算機虛擬的兒子開始工作,傳過去的圖像和攝像頭拍到的幾乎一模一樣,還會點頭揮手微笑眨眼。談的話題與媽媽緊密配合,媽媽說陽台上的花花草草,「兒子」就說自己只會養仙人掌;媽媽說鍛煉身體,「兒子」就推薦一套老年早操;一個小時後,媽媽心情舒暢,「兒子」用「過不多久就到冬至了,您要多穿點兒,小心感冒」結束了這次聊天。在替身與媽媽聊天這段時間,徐迎慶可以繼續研究毛衣上那些細小的纖毛在計算機屏幕上怎麼渲染才逼真的問題,他是微軟亞洲研究院形象計算組的研究員。 將來,我們真會弄不清電話甚至可視電話的另一端是不是「人」嗎? 這是一個讓人們探討了半個世紀的話題。1950年,計算機理論的奠基人阿倫·圖靈在哲學性雜誌《精神》上發表了一篇題為《計算機和智力》的著名文章。這篇文章提出一個檢驗計算機是否在「思維」的方法,後來被稱為「圖靈測試」或者「圖靈檢驗」。檢驗者是一個人,他(她)用非人格的方式(比如通過網路聊天)分別與一個真實的人和一台計算機問答,檢驗者僅僅通過兩者回答的信息來評判誰到底是人。被檢驗者中的人要說服檢驗者他(她)才是真的人;而計算機也被編好程序,程序的目的是讓檢驗者誤認為這台計算機才是人。如果檢驗者通過一段過程比如幾個小時的問答,還無法區分到底誰是人,那麼被檢驗的計算機就通過了測試,被認為能夠「思維」。 圖靈預言2000年到來之前就會有計算機通過圖靈測試,看來他過分樂觀了,至少現在我們還沒有見到一台宣稱可以通過圖靈測試的機器。人們可能會認為,計算機在很多場合表現了它們的「智慧」。一個遊戲玩家說:「我真的不知道那個分割包圍我的坦克部隊、同時派傘兵偷襲我後方基地的混蛋是人還是計算機。」沒錯,有時候計算機顯得相當聰明,但通過圖靈測試比按規則競賽取得勝利要難得多。和計算機對答的時候,你可以用一些騙招。比如像史蒂芬·霍金那樣造一個沒有語法錯誤但毫無意義的句子——站在籬笆下,聽起來像一隻蘿蔔——夾在大段正常的話中讓計算機去判斷,它非瘋了不可,如果它真有思維的話。 「大青蟲」 圖靈的預言沒有實現,計算機雖然被叫做電腦,它們的表現仍和大腦相去甚遠。幾十年來計算機的速度變快、容量增大、種類變多、應用越來越廣泛,計算技術是否像一條青蟲,不斷長大,但是一直沒有羽化成蝶? 「哈哈,這真是個有趣的比喻,」圖靈獎得主托尼·霍爾今年10月在北京對記者說,「你可以這麼說,計算技術的發展是一個漸變的過程,硬體更強,軟體更有用,就像青蟲在長大。」他不願意對「青蟲變成蝴蝶」的時刻做預測,因為「巨大的變化無法預料」。 微軟公司高級副總裁里克·雷斯特認為沒有這麼簡單。「這可不只是一條青蟲的長大,」他說,「你去翻翻你們十年前的報紙,你會發現這十年其實發生了質變。」 雷斯特舉出兩個例子證明現在和十年前根本不同。他的女兒在美國西雅圖,經常通過Internet和她遠在別的國家的朋友聊天、互發照片。另一個例子是,現在12歲的孩子可以使用PC製作出和好萊塢水平相若的電影片段。這些在十年前都是不可想像的。雷斯特說,計算機確實還不能像人腦一樣思考,但它們已經改變了世界。 單純的CPU速度提高或硬碟變大都不是計算技術發生質變的理由。雷斯特認為「青蟲」出現了全方位的劇變。硬體、軟體、網路環境共同進步,多種創造性的應用相繼出現,計算機在現代社會的角色都和十年前全然不同了。 智能和演算法 能夠使用工具是人類的重要特徵。人們對於體力上勝過他們的機器司空見慣,搬重物的有起重機,跑得快得有汽車,這些都沒有什麼好奇怪的。然而當IBM的計算機打敗國際象棋大師的時候,有人坐不住了:計算機如此聰明,它們能力的成長會失去控制,最終危害人類嗎? 圖靈獎獲得者吉姆·格雷在這一點上比較悲觀,他一年前對記者說,將來計算機可能不喜歡人類,它們可以自我完善,不再需要我們,甚至想消滅我們。 迅速提高計算機的能力,人類在養虎為患嗎?微軟亞洲研究院院長張亞勤不相信計算機的智慧能超過人類。他說,要麼讓計算機模擬人的智力,要麼讓計算機不斷學習,逐漸接近人的智力,除此之外,人工智慧(AI)沒有第三條路走。但這兩種方式都決定了計算機智力的極限就是人的智力,不會更高了。 里克·雷斯特說:「人要計算機做什麼,它們就做什麼。」勝過人類棋手的計算機,無非是按照程序設計者事先規定的演算法行事。 所謂演算法,就是求解問題的步驟。比如求兩個數相除的餘數,首先要判斷這兩個數哪一個大;然後用大數減去小數;如果得到的結果仍大於小數,就用結果再減一次小數;重複判斷當前的結果和小數的大小關係,只要大於小數,就繼續做減法,直到結果小於小數;最後的結果就是餘數。同樣地,兩個數相乘也可以分解成多次這樣的簡單運算。由於計算機每秒可以執行很多次簡單運算,它們在求解兩個6位數相乘這樣的問題上,可以輕而易舉地超過人,做得比人快得多。 根據局面求解下一步棋怎麼走最終取勝的概率最大又比兩個數相乘難得多,勝過國際象棋大師的計算機需要很快的CPU、很大的資料庫容量和精巧的演算法。但分開來看,演算法的每一步仍是些簡單的運算,計算機的智能也完全構築在這些簡單運算的機械堆積上。 聰明的編譯器 程序是讓計算機執行演算法的工具。程序編譯器的發展能否讓計算機變得言聽計從、唯唯諾諾?托尼·霍爾是編譯方面的專家,他說,現在還看不到用人的自然語言代替程序語言讓計算機執行複雜演算法的那一天。 編譯器存在的理由其實是計算機「聽不懂人話」。人使用程序語言下達指令,編譯器將這些指令(程序)編譯成機器語言以便符合計算機的邏輯。如果有人讀寫只由0和1兩個數字組成的大段「文章」毫不費力,知道它是讓計算機如何讀寫寄存器、如何累加、如何判斷、如何循環,那麼他用不著編譯器了,直接寫幾頁紙的01碼讓計算機去執行就可以。 這樣的人不存在,所以程序員用一些規範的編程語言寫出程序,通過編譯器編譯成機器語言,計算機才可以按部就班去做。使用編程語言已經是遷就計算機的體現了,雖然可以被讀懂,但「if i現在的編譯器針對一處程序錯誤,比如循環嵌套不妥帖,會報出六七條錯誤信息。而人們說話是很隨意的,有時候說些和主題無關的話,有時候顛倒語序,如同古文中的「衍文」和「錯簡」。如果讓編譯器直接處理自然語言,它報出的錯誤信息可能比程序本身還長。托尼·霍爾說,那不是努力的方向。如果說編譯技術將有里程碑式的進步,這樣的進步可能發生在統一的方法學上。「編程領域很多研究人員各自為戰,他們的力量被分散了。如果有一個統一的理論把他們的工作結合起來,編譯器就會很快變得聰明——所謂聰明也就是減少程序員排錯的時間,讓他們集中精力在通過程序實現需求上。」 統一理論在物理學中可以找到一個類比:融合廣義相對論和量子力學的量子引力論。但物理學主要研究連續的世界,計算科學研究離散的世界,與連續世界的理論相比,離散理論落後很多。 「你能指望計算機怎麼樣呢,它們蠢得像海參,」托尼·霍爾說。 計算機的意識 海參雖然低等,也已經是動物了。計算機現在像海參,但它們能否逐步進化到高等動物的水平?里克·雷斯特說計算機是不會自己進化的,一切都要人來推動。 吉姆·格雷的觀點正好相反,他同意,能否進化,生物體並不比計算機具有構成上優先權。這就是說,由水、蛋白質、脂肪等等構成的生物體可以進化,由導線、矽片構成的計算機也可以進化。分開來看,水、蛋白質和脂肪都沒意識,合成人體之後就有了意識,那麼沒有意識的導線和矽片怎麼就不能合成有意識的計算機呢? 草履蟲看起來沒有意識,海參也可能沒有意識。生物體越來越複雜之後,意識開始出現,貓、狗已經可以表達好惡了。計算機現在沒有意識,是因為還不夠複雜,當它們足夠複雜的時候,意識就會自然出現。對於這樣的觀點,雷斯特說「不」,格雷說「是」。格雷看起來同情強人工智慧(強AI)論者,強AI論者說意識和精神都是一些精巧的演算法。 那麼,複雜到什麼程度,生物體和計算機就可以具有意識呢?我們不知道意識是從哺乳動物還是昆蟲還是別的什麼進化階段進入生物體的,暫且繞過這個問題。我們確切地知道,人類具有意識,那麼複雜如人類大腦的計算機也應該具有意識吧? 將大腦看做一台計算機,強AI論者認為,當大腦運轉的時候,它也在執行一系列演算法,分辨迎面走來的人是不是熟人的過程就是模式識別的過程。如果有一天,造出了可以模擬大腦演算法的計算機,我們能否宣稱它就具有意識? 哲學家約翰·西爾勒否認可以模擬大腦演算法的計算機具有意識,他在上個世紀80年代給出了一個著名的理想實驗「西爾勒的中文屋子」來支持他的論點。實驗的要旨是這樣的:一個用中文講的笑話,中國人聽了會哈哈大笑,如果用一台可以執行複雜演算法的計算機根據這個笑話的詞句進行一系列運算,得出的結果很正確,也是「哈哈大笑」,於是計算機用它自己的方式笑了幾聲,我們是否可以認為這台計算機「理解」了這個笑話呢?不是的。用一大群不懂中文的美國人取代計算機,他們拿著鉛筆和紙重複計算機所做的一切,因為演算法很複雜,可能要全國不懂中文的美國人算上一年才得到了結果「哈哈大笑」,他們派一個代表出來笑了幾聲。雖然反應很慢,但他們和一個中國人做得一樣好,我們卻無法認定這群美國人理解這個中文笑話。如果說,單個美國人不理解這個笑話,但他們的集合體確實理解了這個笑話,那就太牽強了。 對西爾勒觀點的爭論20年來一直沒有平息過。意識和精神,這些概念仍然模糊不清,如同電子云。 AI的「音障」 人不了解自己的大腦,可能這就是問題的癥結。 托尼·霍爾說:「大腦思維和計算機演算法,乍一想這兩者有相似性,但我們對大腦了解得非常少,基本結構都遠遠沒有弄清楚。機器是不可能取代大腦的。」他說,比如編程,人的靈感機器沒有,機器只能用來排錯,「機器只是助手」。 里克·雷斯特認為,大腦太複雜了,沒有人知道它怎麼活動,談不上模擬大腦的演算法。他似乎不願意在「假設有可以模擬大腦演算法的機器,這樣的機器有智能和意識嗎」這個問題上糾纏不休,他大聲說:「再說一次,沒人知道我們的思想到底是什麼,模擬大腦不是我們能做的,所謂智能計算也就是讓機器為我們工作更得力,檢索得更快。」 張亞勤和微軟亞洲研究院的兩位副院長張宏江、沈向洋在合寫的文章中說,一些科學家提出,「人類思維的規則幾乎是不可能被完全破譯的,所以機器所能夠接受的永遠都只是殘缺不全的『人的智能』,再強大的機器也不可能再現人類思維的複雜機制。」 計算技術發展到今天,對大腦結構和思維本質的無知成了人工智慧的「音障」,它們的阻力像激波一樣難以突破。我們對大腦如何工作還沒有一個像樣的理論基礎。我們能做的,也就是讓機器看起來知道一些東西。 務實的妥協 人工智慧和智能計算完全是兩個概念。圖靈獎獲得者約翰·霍普克羅夫特說,計算和通信兩個領域的融合開創了智能計算的新天地,現在計算機已經可以更聰明地幫助人們獲得和處理信息,這已經和人工智慧的概念大相徑庭了。 托尼·霍爾說:「我們的研究者正在把計算機『變得更智能』,而不是『變得智能』。我說過,現在的計算機像海參一樣愚蠢。AI在一些領域取得了進展,比如語音分析、機器人動作、下棋,但更多的問題沒有解決,比如讓機器在三維空間中用兩條腿走路。」里克·雷斯特說:「我們研究的重點是開發技術用於計算機,為人們的生活服務。」 比起讓計算機會思考,很多領域的研究更實用,在計算科學的進程上也具有各自的地位。雷斯特列舉了他關注的40多個研究方向中的幾個:操作系統的魯棒性、軟體的自修復能力、保密和加密、無線通信、自然語言的翻譯、用自然語言做檢索。諸如此類的研究成果得到應用正是「青蟲不僅在長大」的論據。智能計算的研究讓IT遍及天下,催生了細分行業,引導了整個產業的發展。 只要計算機改善了我們的生活,還管它是不是像海參一樣愚蠢呢? 吉姆·格雷雖然是一個人工智慧的支持者,但他也正走在「開發有用的計算技術」之路上。現在,他率領的小組正與美國國家自然科學基金會合作,做數據採集方面的研究。他們使用具有17TB容量的伺服器,在其中存儲大量恆星的信息,開發查詢和分析管理這些信息的方法,建設「虛擬天文台」,幫助天體物理學家揭示宇宙的奧秘。
推薦閱讀:
推薦閱讀: