通過圖靈測試
Bletchley 公園的阿蘭?圖靈塑像 (Jon Callas/Flickr)圖靈是20世紀最偉大的數學家之一。作為現代計算機概念的締造者,他的密碼破譯工作在第二次世界大戰中起到了決定性的作用。在那個創意無限的計算機黎明時代,圖靈率先提出的測試,說來似乎很簡單:如果一台計算機通過對話,能使人們認定它是人類,那麼這台計算機便被認為是具有智能的。
圖靈試驗的標準模式:C使用問題來判斷A或B是人類還是機械。對象為:一個具有正常思維的人(代號B)、一個是機器(代號A)。如果經過若干詢問以後,C不能得出實質的區別來分辨A與B的不同,則此機器A通過圖靈試驗。在現代社會,無論是GPS導航系統與Google搜索引擎,還是自動櫃員機與蘋果Siri,更遑論象棋大師深藍(Deep Blue)和滿腹經綸的沃森(Watson),人工智慧無處不在。但是,迄今為止,沒有一台計算機通過了圖靈測試。雖然如此,在嘗試通過圖靈測試的漫漫征程上,模擬人類思維的願望不斷激勵著我們。這一原動力,對計算機科學乃至認知科學的發展,產生了深遠影響。而現在,我們有理由相信,一台內核代碼已經寫就的計算機,擁有通過圖靈測試的能力。「兩項革命性的信息技術進步,可能將重新給被閑置已久的圖靈測試,帶來新的任務,」法國國家科學研究中心的認知科學家羅伯特?弗蘭茨(Robert French)在4月12日的《科學》雜誌上撰文稱,「第一步是準備數量巨大的原始數據:輸入的內容包括視頻資料和完備的聲音環境信息,以及隨意的談話內容和關於各種各樣事物的技術文檔。第二步是能夠整理、收集、處理這些豐富數據的複雜技術。」這有沒有可能創造出相當於人類大腦的認知水平的神經連結網路?它能感知到我們所感知的嗎?圖靈第一次進行他的測試,是在一次聚會時。他巧妙的實驗令人印象深刻:參加者努力讓評判者相信他們的性別是偽裝的(圖靈本人由於他的同性戀取向受到了嚴酷的迫害)。那時候,這種創建等效於人類大腦認知方式的低水平神經網路的想法還不存在。然而,複製人類的思想似乎很有可能,相比之下似乎更簡單。我們一般認為,人類的思維是邏輯性的,而計算機能夠運行邏輯性的命令。因此,我們的大腦應該是可計算的。計算機科學家由此認為,二十年之內,或許不超過十年,我們就可以看到這樣激動人心的事情:人們無法根據對話分辨出,對方是計算機還是人類。這個過分簡約的構想,被證明是建立在錯誤的理論基礎上的。認知過程要遠比20世紀中葉的計算機科學家及心理學家所設想的複雜得多。並且令人沮喪的是,在運用邏輯學描述我們的思想過程時,科學家遇到了非常大的困難。並且我們越來越清楚:根據人類大腦所特有的,適應快速變化的外界環境、整合信息碎片等一系列特殊功能來看,模仿人類思維幾乎是無法完成的任務。「對於現實中眾多不確定性而言,符號邏輯本身過於脆弱,」斯坦福大學研究機器智能模擬的計算機科學家諾亞?古德曼(Noah Goodman)如是說。儘管如此,現在被我們認為已經失敗的傳統AI,技術上依舊頗具啟發性。因為它們徹底改變了,我們對於人類大腦運作方式的看法。挫折過後,不斷湧出的是許許多多極其重要的認知科學新觀點。直到20世紀80年代中期,圖靈測試一直都是被放棄閑置的探索領域(儘管今天,它衍生出了專為虛擬聊天機器人設置的年度Loebner獎,同時即時虛擬廣告機器人在我們的日常生活中也益發普遍)
(康奈爾大學創新機器實驗室的兩部虛擬談話機器人正在進行非常有趣的嘮嗑)與此同時衍生出的是現代認知科學和人工智慧的兩個主要研究方向:1.推算事件發生的概率,做出準確判斷。(稱為概率性)2.在與簡單、微小的程序的互動過程中,得出複雜的行為模式。(稱為連結性)和那些像深藍(Deep Blue)(曾因擊敗國際象棋大師Garry Kasparov揚名)一樣使用「蠻力」的電腦程序的計算特點不同,人們認為這些程序至少精確反映出了,人類思維中產生的某些特有現象。迄今為止,所謂「概率性」和「連結性」這兩大人工智慧研究新思路,指導開發出了一系列現實生活中被廣泛使用的人工智慧產品:自動駕駛汽車,Google搜索引擎,自動機器翻譯,以及IBM開發的能巧妙回答任何刁鑽古怪問題的Watson電腦。
IBM的Watson電腦擊敗Ken Jennings,他是Jeopardy! 節目的人類最高水平玩家。但是美中不足的是,它們在某些方面能力仍舊有限——「如果你說:『Watson,給我做晚飯好不好,』或者『Watson,寫首十四行詩吧,』他會憋炸的。」古德曼這樣說道。但是人們不斷上漲的使用(或調戲,好吧)慾望使它們的性能得以飛快進步,資料庫更詳實。「你所說過的、聽到的、寫下的、或者是讀到的每一個字,每一句話,以及每一個看到的場景,每一段經歷的聲音片段,一併同其他成百上千、甚至成千上萬的人們的相關數據,都被錄製下來並可隨時調用。久而久之,甚至觸覺以及嗅覺感測器也可以被接入以全面豐富我們這個充滿圖像和聲音的資料庫。」作為對MIT(麻省理工)研究員戴伯?羅伊(Deb Roy)的相關研究的延伸,弗蘭茨在《科學》雜誌上這樣設想。戴伯曾經錄製了9萬小時的視頻,內容是關於他襁褓中的兒子清醒狀態下的認知發展過程。假定我們擁有可以編目、分析、串聯和交叉全部海量信息的處理軟體,以及備有上述資料庫和分析系統的程序,應該完全能夠使得一台計算機回答現今的AI們無法回答的棘手問題。這最終意味著通過圖靈測試。密歇根大學的人工智慧專家賽汀德?辛(Satinder Singh)對數據所顯示的前景充滿了信心:「大容量資料庫終會造就一台極具靈活性的人工智慧機器。」但這樣來說,梳理所有曾經學習過的問題數據就顯得重要了許多。計算機要懂得:什麼更值得記住,什麼更值得去預測。可是,如果你把一個孩子領進屋內,讓他自由自在、隨心所願,不交給他任何任務,他為什麼會自發地做他想做的事情呢?所有的這類問題都變得異常有趣。「為了變得更淵博,更靈活,更有能力,一個人必須要被動力和好奇心所驅使,從而提煉出重要的事情,」辛說:「這些對計算機來說,都是巨大的挑戰。」「一架機器要通過圖靈測試,一定要充滿著人類的情感與慾望嗎?。就像是弗蘭肯斯坦(瑪莉?雪萊(Marry Shelley)筆下的人造人),或者有生命的泥人(Golem希伯萊傳說中用粘土、石頭或青銅製成的無生命的巨人,注入魔力後可行動)一樣嗎?」墨西哥國立自治大學的計算機科學家卡洛斯?格申森(Carlos Gershenson)充滿了疑問。但是這和更基本的問題一樣,難以回答。「這做起來一定很困難,可是我們這樣做的目的是什麼?」他充滿了疑問。編譯自wired網站: Artificial Intelligence Could Be on Brink of Passing Turing Test作者: Brandon Keim
推薦閱讀:
※(Python)時序預測的七種方法
※趣味測試:選一個復古花環,測三年後你會窮瘋還是賺翻? 心理小測試文章
※10道心理測試題:你第一眼看到什麼字,就說明你是什麼人!很准
※產品團隊,開發團隊和測試團隊的關係
※八字財運測試准嗎?