翻過「三座大山」 人工智慧將迎來全盛時代
獵雲網11月11日報道 (編譯:堆堆)
幾個月前,為了能早一步看到一直以來為世人所期待的人工智慧計算機,我長途跋涉來到位於紐約城約克城高地的IBM研究實驗室。這裡是Watson的研發地,這款人工智慧計算機在2011年稱霸智力競賽節目《危險邊緣》。初始版本的Watson也還在這裡,它的體積大概有一個卧室那麼大,周圍有十台冰箱式機器豎直的放在它的旁邊,就像是四堵牆。技術人員可以通過內部的小孔將電纜連到機器背部。Watson機器內的溫度相當高,就像整個集群活過來了一樣。
如今的Watson已經發生了天翻地覆的改變。它不再是只處於機器包圍之中,事實上現在的它正通過大量對用戶免費開放的伺服器傳播,並且能處理上百種人工智慧收到的指令。和其他雲端化的服務一樣,Watson可以為世界各地的用戶同時服務,用戶可以通過使用手機、台式電腦或是他們自己的數據伺服器來使用Watson。這一類的人工智慧可以根據需求不同而增加或者減少。當使用人工智慧的人多了,設計者就會更關注人工智慧的改進,與此同時,Waston也就變得越來越聰明,在一種指令下學習到的東西可以立刻分享到其他的伺服器中。它不單單是處理一個單獨的程序,實際上Watson是各種軟體引擎的集合。它的邏輯演繹引擎和語言解析引擎可以在不同的代碼、晶元以及位置上運行——所有這些智慧的因素最後彙集成了一個統一的智能流。
用戶可以直接連接到永久開啟的智能產品,也可以通過那些使用人工智慧雲服務的第三方應用連接。跟許多高瞻遠矚的父母一樣,IBM希望Watson走上醫療的道路。所以當IBM正打算利用人工智慧開發一款醫學診斷工具應用這一消息傳出,大家並不感到吃驚。在此之前,開發者曾經多次嘗試開發醫療診斷的人工智慧產品,但是均以失敗告終。不過,Wastson成功了。簡單來說,當我輸入一種我在印度感染患上的疾病癥狀,Watson會給我一份類似疾病的清單,依次按照患病的可能性排序。Watson給出的第一個病症,也是我最有可能的病症是Giardia(賈第鞭毛蟲病)——這恰恰好就是正確的答案。這項技術還不能直接對病患開放,IBM將Watson人工智慧提供給它的合伙人,幫助他們設計出用戶用好型界面來進行預訂醫生和醫院服務。創業公司Scanadu的首席醫師Alan Greene在採訪中表示:「我相信在未來類似於Watson的方式——不管是人還是機器——將會變成世界上最棒的診斷醫師。」這家初創企業正是受到電影《星際迷航》中醫用三錄儀的啟發,開始利用雲人工智慧技術製造一種診療設備。Alan Greene還表示:「隨著人工智慧技術的高速發展以及不斷進步,現在出生的孩子長大後都無需去醫院看醫生來診斷病症了。」
隨著人工智慧的發展,我們必須設計出一些阻止其擁有人類意識的方法——我們宣傳的最優質人工智慧服務是基於無意識的。
醫療只是開始。所有大型的雲服務公司以及眾多初創企業,都爭先恐後地推出了類似Watson的機器認知服務。數據分析公司Quid表示從2009年開始,人工智慧就已經先後吸收了超過170億美元的投資金額。光是去年一年,就有就有超過20億美元投資給了擁有類似人工智慧技術的322家公司。此外,Facebook還有Google也都在招募賢能之士,來組建各自公司內部的人工智慧研究小組。Yahoo、Intel、Dropbox、LinkedIn、Pinterest和Twitter也都在去年收購了不同的人工智慧公司。在過去四年的時間內,人工智慧領域的私人投資以年平均增長率62%的速度增加,據估計,這樣的增長速度還會繼續保持強勁勢頭。
各行各業中人工智慧產品的運用已經以雷霆之勢闖入我們的視線。它不是和《2001太空漫遊》中的HAL 9000一樣擁有與人類一般的意識,也不是遊戲《奇點》擁護者喜愛的超智能。未來出現的人工智慧更像是一款價格低廉、可靠、工業化並且類似於網頁版亞馬遜的服務。這款電子智能默默地運行在所有活動的「幕後」,幾乎不為人察覺,只有當它在偶爾閃爍幾下的時候,你才能夠注意到它。人工智慧可以提供給你所需要的智能,並且不多不少。和其他設備一樣,人工智慧也會變得超級無聊,即便它對互聯網、全球經濟還有人類文明產生了深遠的影響。它可以使得無生命的物體變活,就像一個世紀之前的電力一樣。在電力發明之後,我們就開始認可所有電器的使用。而人工智慧這種新設備也會改變每個人的生活(比如增強記憶力,加速認識能力)還有整個人類的生活。當今世界,利用智能,我們幾乎可以將所有事物都變得新穎、不同而且有趣。事實上,由此我們都可以輕而易舉的預測到接下來1萬家初創企業的企業計劃:選取一個事物然後添加人工智慧。對於整個人類而言,人工智慧可以改變我們的人生,而如今這項技術終於成熟了,新的時代就要到了。
在2002年我參加了Google的一個小型聚會,當然這次聚會還是在Google首次公開發行股票之前,那時Google還在專註於搜索領域的開發。我有幸和Google的聯合創始人Larry Page交談,Larry Page是一個非常傑出的聯合創始人,在2011年他成為Google的首席執行官。我跟他說:「Larry,我始終不理解。現在網路上有那麼多的搜索公司,可是你們為什麼要做免費網頁搜索?到底是什麼促使你做出這個決定呢?」提出這個問題,事實上就已經表明了我那缺乏想像力的無知,正因為無知,所以才很難對未來做出預測。然而在我看來,在谷歌擴大其廣告拍賣方案來獲得實際收益時,甚至在Google在收購TouTube以及其他大宗收購時,我不是唯一一個一邊狂熱的使用Google的搜索網址的同時,一邊認為這項免費的網頁搜索引擎將「命不久矣」的人。然而Page的回答卻讓我大吃一驚,他說:「其實我們是在做人工智慧。」
在過去幾年內,Google收購了14家人工智慧以及機器人公司,於是我對之前我和Larry Page的對話有了更深的理解。乍一看,你可能會覺得Google只是在增加它在人工智慧上的投資組合,從而來提升搜索能力,畢竟80%的收益都來源於搜索技術。但是我認為這恰恰相反。Google並非是利用人工智慧來改進搜索技術而是利用搜索技術在改進人工智慧。每當你輸入進一個問題時,輕輕點擊一個相關的搜索鏈接,或者是在網頁上創建一個連接,其實你都是在訓練Google的人工智慧。當你在搜索欄內輸入「復活節兔子」,然後點擊最像復活節兔子的圖像時,你就是在教人工智慧復活節兔子長什麼樣。Google每天擁有12億搜索用戶,一天內能產生1210億次搜索,每一次搜索都是在一遍又一遍的輔導人工智慧進行深度學習。隨著這十年來人工智慧演算法的穩步改進,再加上較之以前已經增加了一千倍以上的數據、一百倍以上的計算資源,谷歌將會開發出一款無與倫比的人工智慧:到2024年,Google的主打產品將不再是搜索引擎,而是人工智慧。
毫無疑問,這樣的觀點將會引來很多人的懷疑。長達60年里,人工智慧的研究員都做出了這樣的預測:人工智慧的時代就要來臨。然而幾年前,人工智慧技術好像還遙不可及,人們甚至還創造出了一個術語拿來形容人工智慧研究成果以及投入資金的匱乏,那就是:人工智慧的寒冬。而如今,這一切發生了改變了嗎?人工智慧的時代真的來臨了嗎?
是的,最近技術上的三項突破使得人們盼望已久的人工智慧時代終將來臨。
1.低廉的並行運算
思考是一種人生來就有的並行過程,數十億的神經元同時啟動來創造出用於大腦皮層計算的同步電波。創建一個神經網路——即人工智慧軟體的主導結構——需要不同的計算進程同步進行。神經網路中的每一個節點都是大致模擬出人腦中的神經元,通過將計算結果傳遞給周邊的節點來實現信號接收,相互作用。如果要理解一個口語單詞,選擇的人工智慧成語就必須要分清彼此之間的所有音素;如果要分辨出一張圖片,就必須要看清楚圖片周圍環境中的每一個像素。這兩者都屬於深層次的平行任務。但是就算是在如今人工智慧快速發展的時代,標準的計算機處理器也只能夠一次處理一項任務。
不過事情在十年前就發生了變化。一種叫做圖像處理單元的新型晶元可以滿足電子遊戲中高密度的視覺以及並行需求。在此運行過程中,每秒都有上百萬的像素被多次反覆計算。這就需要一個專業化的並行計算晶元。將該晶元添加到電腦的主板中,作為對於並行計算的補充。當並行圖片在遊戲中起作用了,遊戲也就會吸引更多的用戶。到2005年,GPU晶元產量大幅度提高,隨之晶元價格便降了下來。2009年,Andrew Ng以及斯坦福大學的一個研究小組意識到,GPU晶元可以並行運行於神經網路之中。
這一發現迎來了神經網路發展的新機遇,使得神經網路能夠在節點之間容納上億個連接。傳統的處理器需要幾周時間才能夠計算出擁有1億節點的神經網路的級聯可能性。而Andrew Ng發現在一個CPU集群可以在一天之內就完成這樣龐大的計算。現如今,許多雲計算公司都採用了CPU來運行神經元網路,比如說Facebook則利用這項技術來辨別照片中的朋友,Netflix則會利用該技術給5000萬用戶推薦靠譜的信息分享。
2.龐大的數據積累
每一種智能都需要經過教導的。人類的大腦即使天生就有給事物分類的能力,也仍需要後天的培育——即看過許多例子之後才能分辨出貓和狗的差別。人工智慧也是如此。就算是擁有最高級的程序也需要在進行一千次國際象棋比賽後才能夠掌握比賽規律,有良好表現。人工智慧突破的部分原因在於對我們現處的這個世界收集到的大量數據,因為這些數據給人工智慧提供了它們進步學習所需要的材料。大型資料庫、自動跟蹤、網頁書籤、上網歷史記錄、百萬兆位元組存儲、數十年累積的搜索結果、維基百科以及整個數字世界都成了人工智慧的老師,是它們讓人工智慧變得更加聰明。
3.優化的演算法
在20世紀50年代,人類成功發明了電子神經元網路,然而隔了約數十年,計算機科學家才學會如何駕馭這種百萬乃至億個神經元之間龐大的組合關係,這樣的天文數字讓人想想都覺得可怕,更不要提處理神經元之間的關係了。而處理這個問題的關鍵在於將神經網路組織成為堆疊層。舉一個比較簡單的應用例子——人臉識別。當神經網路中的一組比特被辨別出來,這就形成了一個圖像——比如說眼睛的圖像——這個結果將會被傳遞到神經網路的上一層進行下一步分析。而下一個級別的分析則會將兩隻眼睛組合在一起,然後把有意義的數據塊傳遞到等級結構的另一層,在那裡將把眼睛與鼻子的圖像結合在一起。辨別人臉的過程將需要數百萬的節點(每一個節點都會產生出計算結果給周圍節點使用),最後總共累積成15層。2006年,Geoff Hinton在多倫多大學對這項方法進行了一次重要改進,然後將這種方法命名為「深度學習」。他從數學層面上優化每一層的計算結果,這就在加速對疊層運算的同時加速學習進程。幾年後,深度學習演算法被移植到CPU中時,其運算速度又有了大幅度提升。僅僅是深度學習的代碼是不足以進行如此複雜的邏輯推理,但是這是現有的所有人工智慧產品的重要組成部分,包括IBM的Watsn,Google的搜索引擎還有Facebook的演算法。
並行運算、龐大的數據、優化的演算法,這三者組合成完美風暴促成了60年來人工智慧的「一鳴驚人」。而這三者的結合也暗示了一個事實:只要技術發展的趨勢仍繼續,我們沒有理由不相信人工智慧不會精益求精,繼續造福人類。
事實上,它也是這樣做的。基於雲應用的人工智慧成為了我們日常生活中密不可分的一部分。但是好事可不會從天而降,往往人們也要為此付出一定的代價。雲計算符合收益遞增的規律,有時候這種規律也稱之為網路效應,這就是說隨著網路的發展壯大,網路價值也會以更快的速度隨之增加。然而,網路越壯大,對於新用戶的吸引力也就越強,這也就使得網路變得更大,吸引力更強,不斷循環這樣的過程。為人工服務的雲技術也遵循這樣的規律。越多的用戶使用人工智慧,人工智慧就會變得越聰明;它變得越聰明,就會有更多的用戶使用它;當越多的用戶使用它,人工智慧理所當然的就會變得更加聰明。所以一旦某一個公司進入到這樣的良性循環,那麼它必然將以更快的速度發展壯大,從而將所有的新興企業甩到幾十條街後。然而,這樣問題就來了。人工智慧的未來很有可能就由兩到三種大型、多用途並基於雲技術的商業智能產品統治。
1997年,Watson的前輩,也就是IBM的Deep Blue在一場著名的人機比賽中打敗了當時的國際象棋大師Garry Kasparov。在之後的幾場比賽中,電腦都取得了勝利,大部分人對這類比賽就已經失去興趣了。也許你認為這就是故事的結局,實際上你可能只能猜中了開頭。Garry Kasparov意識到如果他可以跟Deep Blue一樣,能夠立刻訪問以前所有國際象棋比賽中的棋路,他就能夠在和Deep Blue的比賽中表現得更好。如果這個資料庫對於人工智慧設備而言是公平的話,為什麼人類不能夠使用呢?為了踐行這個想法,Kasparov首次提出了人加機器比賽的概念,在這類比賽中,人工智慧機器將作為輔助工具幫助國際象棋棋手提高,而不是讓人類棋手與之對弈。
如今被稱為自由形式的國際象棋比賽更像是一種混合型的武術比賽。選手可以使用任何他們能想到的格鬥技巧來比賽。你可以不藉助外界幫助、只靠自己進行比賽,又或者你可以藉助超級聰明的智能電腦來幫助你比賽。你要做的僅僅是按照它的建議移動棋盤上的棋子;又或者你可以成為一種電子人,即Kasparov提出的「半人半機」選手。電子人棋手會聽取人工智慧設備給出的建議,但是偶爾也會忽視這些建議——這和我們開車時候使用GPS導航系統一樣。在2014年自由式國際象棋錦標賽中,參賽選手類型不限制,純人工智慧引擎贏了42場比賽,而電子人棋手則贏得了53場比賽。現如今,最優秀的國際象棋棋手就是電子人Intagrand,這是一個有幾個人類加上幾個不同國際象棋程序組合成的隊伍。
但是最令人震驚的是:人工智慧的出現並沒有使得純人類的國際象棋棋手水平下降。相反,廉價、超級智能的國際象棋程序吸引了越來越多的人下國際象棋。國際象棋的比賽也比之前舉辦的多了,棋手的水平也比以前高了。如今的國際大師人數要比Deep Blue首次戰勝Kasparov要多兩倍。當今頂尖的人類棋手Magnus Carlsen就曾通過人工智慧進行訓練,他被認為是所有人類國際象棋棋手中最接近電腦下棋水平的棋手,當然他也是一直以來排名最高的人類國際象棋大師。
如果人工智慧幫助人類成為更優秀的國際象棋選手,那麼我們就有理由相信它能夠幫助人類成為更出色的飛行員、醫生、法官或者是老師。大多數由人工智慧完成的商業工作都應當是由具有特殊目的、有一定限制的軟體完成,比如說將某種語言翻譯成另外一種語言,但卻不能翻譯成其他語言。再比如說,它們可以開車但是卻不能夠與人交談。又或者他們可以回憶起TouTube上每一個視頻的每一幀像素,但是他們卻不可以預測的日常工作。在未來十年內,99%的人工智慧產品都將可以與人進行間接或者是直接的互動,它們都將是類似於書獃子一樣的專心於工作、極度聰明的專家。
事實上,這不是真正的智能,或者應該說這不是我們所想要的智能。的確,智能也許是一種不利因素——尤其是我們用智能來形容我們所特有的自我意識、一切狂亂的自我反省還有混亂的自我意識流。我們希望無人駕駛的汽車能夠不受干擾的在路上行駛,不要再糾結與車庫之間的爭吵。在我們醫院的綜合醫生Watson也應該專註於它手頭上的工作,而不該糾結於它是否應該專攻英語。隨著人工智慧技術的不斷發展,我們應該想辦法來遏制人工智慧產生自己的意識——我們在宣傳中指的優質服務應該是無意識的人工智慧服務。
我們想要的不是智能,而是人工智慧。和普通意義上的智能不一樣,智慧是一件更專註、可測量、非常具體的一個事物。人工智慧思考方式和人類形成認知的方法完全不一樣。這裡有一個關於非人類智能的小例子。今年三月在德克薩斯州奧斯汀舉行的西南偏南音樂節,IBM研究員給Watson增加了一個由在線菜譜、美國農業部推行的營養表以及如何讓食物更加美味的研究成果結合而成的菜肴資料庫,這一做法讓世人都驚呆了,大家從來沒有想過人工智慧還能這樣使用。根據這些數據,Watson創造了很多新菜肴。而這些新菜肴則是依據如何讓食物美味的研究成果、現有的一些美食菜譜,然後讓人類大廚將這些菜肴做出來。Watson構造出來的最受歡迎的一道菜就是美味版本的炸魚和炸薯條,這道菜是用酸橘汁腌魚和油炸芭蕉製成。在約克城高地的IBM實驗室里,我有幸品嘗了這道菜,也吃了另一款由Watson創造出的美味菜肴:瑞士/泰式蘆筍乳蛋餅。味道很棒,不過可以想像,沒有人工智慧的創造力,世人可能一輩子都無緣品嘗到這些美味的菜肴。
非人類的智能不能算是錯誤,它不過是人工智慧產品具備的一種特徵。所有人工智慧的主要特徵就是他們不同於人類的智力——相異智能。這體現在很多方面:比如說某一個人工智慧對於食物的思考就不同於任何一個大廚,這也使得我們可以用不同的角度看待食物。不單單是食物,還包括生產材料、衣物、金融衍生工具又或者是科學藝術的分支。而恰恰是這種相異性,給人類帶來了更多的價值,而這些價值絕不僅限於人工智慧的速度或者是力量。
事實上,它所做的正是幫助我們更好地理解智能這個概念。在過去,我們通常認為只有那種超級聰明的人工智慧才能開車或者在《危險邊緣》這個節目里稱霸甚至是在國際象棋大賽中戰勝人類。但是一旦人工智慧在以上比賽或者節目中戰勝了人類,我們就會認為這些成就呆板,並且根本稱不上是真正的智能。事實上,每一次人工智慧獲得的成功都將重新賦予它自己新的定義。
不過一直以來,我們不但是在重新定義我們所理解的人工智慧,也在重新定義人類自身存在的意義。過去的六十年里,機械加工不斷複製了人類特有的行為和才能,這就使得我們開始深思我們進行機械加工的初衷,是什麼將我們和機器區分開來。隨著我們開發出越來越多的人工智慧,我們將不得不放棄很多人類特有的特點。在未來十年,或者可以說是在下個世紀,我們將遭遇一場空前持久的身份危機,我們不得不捫心自問人類存在的意義。不過最值得諷刺的是,我們每日接觸到的實用人工智慧產品帶來的最大益處並不是社會生產力的增加,經濟的蓬勃發展或者是科學技術的突破,儘管這些很有可能會發生。人工智慧的到來帶來了很多益處,其中最重要的莫過於人工智慧的出現幫助我們定義了人類存在的意義。我們需要人工智慧告訴我們——我們究竟是誰。
遍布世界各地的人工智慧產品
在過去五年里,低廉的運算、新穎的演算法還有大量的數據形成了眾多基於人工智慧的服務,而這些服務之前本都處於構想或者是僅僅是紙上談兵的狀態。
谷歌無人駕駛汽車:Google最初的目標是為整個網路編寫索引,而如今,它希望為現實編寫索引——因此它開始著手於完善無人駕駛汽車。在汽車根據給定的某一個路線行駛前,Google司機將會掃描整體路線,然後給出一個最準確的地圖。這類無人駕駛汽車僅僅是利用其車頂部的激光、攝像頭、雷達系統來檢測周邊環境中任何不同尋常的事情就可以選擇出一條最合適的路線。這無疑比建立一個全世界的實時地圖要方便得多。
Body Tracker(身體追蹤器):為了讓用戶通過操控自己的身體來進行遊戲,Microsoft的Xbox項目的研究員Kinect不得不採取一種全新的機器學習的技術。首先,這個設備內部的紅外發射器以及感測器會創建出用戶形體的整體框架3D圖,並且還會對用戶身體不同的幾個部分進行分析,包括肩膀、腳還有手。然後運用一種叫做決定預測的方法,Kinect的人工智慧系統就可以預測到用戶身體下一步最有可能做出的動作。這個系統相當於對你的動作進行實時監測,此外,該系統也不會對XBOX的記憶卡造成任何損傷。
Personal Photo Archivist(個人照片檔案): Matt Zeiler的設計目的是希望用戶找到一張照片就像在手機通訊錄中找到一個聯繫人一樣簡單。他剛剛成立的公司Clarifai正在推出一款全新的搜索技術,在用戶的手機上對照片編索引。當過時的圖片搜索應用還在通過色彩、線條來尋找照片的時候,Clarifai的人工智慧應用已經理解了照片中的對角和平行線條存在的意義,據此當他們研究了越來越多的圖片時,他們也就掌握了更高級別的概念。
Universal Translator(通用翻譯器):Skype的這款翻譯工具首次亮相於年末的測試版,它能夠實時進行翻譯,可以讓不同語言的所有人自然進行交談而不需要譯員在一旁翻譯。這款人工智慧軟體在推出之前進行了百萬次翻譯句子的練習,最終可以猜測出一堆混亂的詞語組成的意思。至於聲音識別,Skype分解了聲音的樣本,不斷進行分析,最終使得人工智慧產品能夠很好地理解不同的發聲方式形成的語言。
Smarter News Feed(智能信息流):Facebook僱傭了世界上最有名的深度學習專家Yann LeCun,並在去年組建了一個人工智慧實驗室。Yann LeCun的任務是改進社交網路的聲音、圖像辨別軟體,使之能夠更有效率的在視頻中找到你想要看到的好玩的照片,比如說你的朋友在某一個聚會中的照片。
本文來源:獵雲網
推薦閱讀:
※人工智慧 | 7,Jeff Dean:谷歌大腦2017總結
※【討論】機器人在以後真的能代替人類嗎?
※從「稜鏡門」到「大選門」,你的「艷照門」還有多遠?
※開篇 - 為什麼要研究人工智慧