南方周末：阿爾法狗真的讓人擔心嗎？

06-27

　　2016年3月15日，韓國首爾，人機大戰第5局，李世石與谷歌「阿爾法狗」的對弈正在進行中。由於此前「阿爾法狗」已經以3比1領先，這一局的結果不影響人工智慧在圍棋領域內戰勝人類這一事實。（東方IC/圖）　　圍棋是人工智慧領域的一個具有標誌性的挑戰，現在「阿爾法狗」戰勝了世界冠軍李世石，是否意味著霍金對人工智慧的擔憂將成為現實？人工智慧對人類生存的威脅會超過核武器嗎？對於這一重大問題，一些人工智慧的支持者卻不這麼認為。　　2016年3月13日，世界圍棋冠軍李世石執白在第78手下出「神之一手」戰勝「阿爾法狗」（AlphaGo）。而在此前的三次對壘中，李世石無論執黑執白，都沒有還手之力，在人類一直引以為傲的圍棋領域，人工智慧戰勝人類已成定局。　　正如谷歌董事長施密特表示：「這次無論誰勝誰負，實際上都是人類的勝利，因為正是因為人類的努力，才讓機器學習有了現在的進展和突破。」　　從象棋到圍棋，人工智慧已經攻克了人類最複雜的封閉博弈系統。如今，網上流傳著一句話：「人工智慧像一列火車，你聽到了隆隆聲，你盼著它來。它到了，一閃而過，便遠遠地把你拋在身後。」　　在圍棋上戰勝人類後，人工智慧真的讓人擔心嗎？　　從「算」到「想」　　舉世矚目的「阿爾法狗」和李世石對戰，並不是歷史上第一次人機對戰的棋類運動。1997年，IBM的「深藍」戰勝了俄羅斯國際象棋大師卡斯帕羅夫。當時，「深藍」2勝1負3平的戰績讓卡斯帕羅夫深受打擊。後來，IBM還拒絕了卡斯帕羅夫的再戰請求，拆卸了「深藍」，讓給他至今無法找「深藍」復仇。　　卡斯帕羅夫的遺憾並不無理由——今天，「深藍」的確算不上「聰明」的電腦。「深藍」主要依靠強大的計算能力窮舉所有路數來選擇最佳策略。依靠硬算，「深藍」可以預判12步棋，而卡斯帕羅夫可以預判10步，二者勢均力敵。　　當然，「深藍」必須具有相當的計算速度。據認為，「深藍」實際上是一台超算機，有480顆特別製造的象棋晶元，下棋程序以C語言寫成，運行AIX操作系統，其計算能力在世界超級電腦中排名第259位。　　然而，圍棋在複雜程度和組成數量上遠超國際象棋，是目前最複雜的博弈類封閉遊戲。2015年1月28日，Nature雜誌在封面論文中稱，圍棋是人工智慧領域一個具有標誌性的「大挑戰」，源於圍棋「巨大的搜索空間、很難估計局面和下子」。圍棋棋盤上每一點，都有黑、白、空三種情況，棋盤上共有361個點（19乘19），理論上可能產生的局數為3的361次方種。這個數字大概是10的170次方，比已觀測到的宇宙中原子數量還多。國際象棋只有10的46次方。　　除了棋盤大，圍棋在下棋過程中還會出現「吃子」的情況，更加劇了其複雜性。曾任職谷歌公司的李開復說，當年「深藍」與卡斯帕羅夫的對局，實際上使用的是人工調整的評估函數，並用特殊設計的硬體和「暴力」（brute-force）的搜索征服了國際象棋級別的複雜度。　　圍棋則不行。「因為它的搜索太廣，每步的選擇有幾百而非幾十。也太深，一盤棋有幾百步而非幾十步。」李開復在知乎上回答稱。　　所以，只靠算，計算機恐怕無法學會下圍棋。在「阿爾法狗」問世前，最成功的圍棋計算機程序能達到業餘人類選手的程度，但還不能和專業選手在不讓子的情況下平局。2014年初，圍棋程序「瘋狂的石頭（Crazy stone）」在一次比賽中戰勝九段棋手依田紀基。但是當時是在人類棋手讓出4子的情況下贏得比賽。　　開發這款程序的法國程序員Rémi Coulom在得知李世石將在不用讓子的情況下對戰谷歌公司的「阿爾法狗」時，感到既興奮，又有些難以置信。他表示，這是人工智慧巨大的進步，而他原本以為這一天將在十年後到來。　　在「瘋狂的石頭」的設計中，Coulom使用了被稱為「蒙特卡洛樹」的搜索技術。這種演算法對大量隨機過程進行統計評估，得出一個最優的解法。也就是說，蒙特卡羅演算法對計算進行了篩選，資料庫中的低勝率選擇直接拋棄，放棄了窮舉法中那些大量消耗計算資源，但卻沒有意義的計算，使其對具有高勝率的選擇有更加精確的計算和分析。　　加拿大艾伯塔大學計算機科學家喬納森·謝弗曾設計程序提高計算機的國際跳棋水平，試圖遇到了瓶頸。他發現，就算使用了蒙特卡洛樹演算法簡化了運算，計算機依然無法獲得人類高手擁有的「棋感」。　　作為一名圍棋愛好者，Deep Mind公司的CEO哈薩比斯也表示，人類頂級大師中，走法很多時候依靠直覺。在他的理解中，「棋感」是指棋手能夠根據形勢分析攻防線路，還需要對棋形進行審美，這也是圍棋幾千年來讓人著迷的原因。所以，從2014年開始，包括臉書（Facebook）、谷歌的Deep Mind等人工智慧研究團隊都將使程序模仿人類的直覺作為圍棋人工智慧的突破方向。　　直到論文發表的前一天，即1月27日，Deep Mind團隊在Nature雜誌網站上宣布：「谷歌公司的人工智慧掌握了古代圍棋。」　　像人類那樣學習和進化　　3月9日，人機大戰的第一場中，「阿爾法狗」獲勝。　　接受美國科技媒體「The Verge」採訪時，哈薩比斯表示，看到比賽中「阿爾法狗」的特殊舉動，他感到有些意外。哈薩比斯從「阿爾法狗」的棋風上看出了「侵略和大膽」。　　李世石以好戰而聞名，首場比賽一開始，他就在整個棋盤上假裝求戰。傳統的圍棋程序在處理這種情況時非常無力。而哈薩比斯看到，「嗯，它在比賽中戲耍了李世石」。　　而在第四場的較量中，序盤雙方不相上下。從第78手開始，當李世石連下三步妙手之後，「阿爾法狗」開始應對不及，出現了很多「問題手」，直接導致101手出現低級錯誤。李世石覺得，阿爾法圍棋有兩個弱點，一是它執黑時下得困難，二是它遇到沒想到的一手棋時應對能力下降。　　在與李世石對戰前，2015年10月，「阿爾法狗」已經與歐洲圍棋冠軍樊麾進行了比賽，樊麾以0比5失敗。「『阿爾法圍棋』的棋風很像人，如果是在網路上對局，恐怕猜不到對手是個計算機程序。」樊麾在賽後說。　　1950年，圖靈在曼徹斯特大學提出了著名的「圖靈測試」理論，代表著人工智慧的概念被初步提出。圖靈提出，一個人和一台機器隔開的情況下接受測試，當提問者不斷提出各種問題來判別回答者是人還是機器時，如果機器有30%的回答騙過了提問者，這台機器就通過了測試，被認為具有人類智能，即人工智慧。　　毫無疑問，「阿爾法狗」通過了「圖靈測試」。　　中科院計算所副研究員陳天石告訴南方周末：「『阿爾法狗』的核心思想是深度學習和增強學習。」　　他指出，深度學習的核心思想是大規模、深層的人工神經網路。正是依靠神經網路，當面對新問題時，「阿爾法狗」能像人類一樣從以往的經歷中總結出經驗來解決問題，而不再用扔硬幣式的窮舉法來試圖尋找概率最大的解決方案。　　神經學家的研究成果告訴我們，大腦由神經細胞和突觸組成，突觸和神經細胞間的電信號形成了意識。微觀上來說，神經通路每接通一次，人的意識和行為就將得到一次正面的強化，這就是學習的過程。　　早在馮·諾依曼時代，科學家也想用電腦模擬大腦，神經細胞和突觸分別對應計算單元和通路。虛擬的「大腦」接受任務時，調用不同的信號通路去執行，任務成功則該通路得到「正面強化」。　　神經網路系統模仿以人類大腦為原型的信息處理模式，使神經網路可以根據特定的輸入產生特定輸出，並實現圖片識別、語音識別等功能。　　2015年，谷歌在2015I/O大會上推出了圖像識別技術。據該項目的工程師介紹，這一圖像識別系統具有30層神經網路，每一層對應著不同的抽象程度，比如最低層次能識別光線、色彩，下一層次能識別圖片的邊緣等等。這樣一層層的「訓練」需要大量的數據。每一層都能提取出更高層次的細節，而最後一層會決定AI對圖片的理解。　　不過，這項技術最後呈現的結果讓人啼笑皆非。在測試中，當提問者輸入「啞鈴」的時候，系統輸出了帶手臂的啞鈴。這說明，在輸入學習的圖片庫中，啞鈴從來都是和手臂一起出現的。而輸入一張滿是噪點的圖片，系統輸出了「香蕉」。儘管這項技術的精確度還不高，但這已經足夠說明神經網路如何讓機器學習到知識。　　「阿爾法狗」的神經網路具有增強學習的功能。「增強學習的核心思想則是不直接給信號而讓機器學習模型通過多次反饋得到改進。「陳天石說。　　Deep Mind公司的工程師為「阿爾法狗」做了兩個神經網路。早在1月28日Nature雜誌發表的論文中提到，「阿爾法狗」會利用「價值網路」預測局面，「策略網路」負責選擇下一步走法。　　自項目啟動以來，程序員在程序中錄入了多達3000萬步職業棋手的棋譜，用增強學習的方法訓練「阿爾法狗」，讓它自己下棋，研習棋譜。這將預測對手下一步棋落子的準確率提升到57%。隨後讓系統進行自我博弈，計算出比已經學習到的棋譜更多新的落子策略，戰勝人類就要靠這些新的東西。　　Deep Mind的工程師David Silver表示：「在與其它神經網路和它自己對戰數百萬局後，『阿爾法狗』學會了自己發現新策略，並逐漸提高了水平。」　　陳天石表示，深度學習和增強學習的結合在業界被稱為「深度增強學習」，也就是大家俗稱的「人工神經網路的自我進化」。　　在戰勝樊麾後，工程師們將「阿爾法狗」的硬體從1202個CPU增加到1920個CPU，加上超強的學習能力，「阿爾法狗」迅速完成自我進化，最終「耍」了頂尖棋手。　　2016年1月28日Nature雜誌封面。正是發表在這一期雜誌上的論文，奠定了人工智慧戰勝人類的基礎。（南方周末資料圖/圖）　　「奇點」來臨了嗎？　　在科幻電影《超驗駭客》中，約翰尼·德普飾演的科學家因為研發人工智慧而被恐怖組織暗殺，臨死之前倉促地將自我意識上傳至電腦中。最後，這名科學家成為一個能夠不斷進化的結合生物智慧和人工智慧的「超級計算機」。　　「阿爾法狗」戰勝李世石之後，人工智慧通過自我進化增加智慧已經變為現實。搜狗CEO王小川認為，人工智慧能做到隨著時間推移變得越來越聰明，正如金庸小說中老頑童讓自己左手和右手「左右互搏」練就天下無敵的武功。　　「在下棋這個領域，『阿爾法狗』這樣一台在演算法上沒有天花板的機器，將有機會登峰造極。」王小川評價說。　　並非所有人都對人工智慧報以樂觀的態度。早在1993年，美國科幻作家弗諾·文奇在《即將到來的技術奇點》一文中寫道：「在未來30年間，我們將有技術手段來創造超人的智慧。不久後，人類的時代將結束。」在他的描述中，所謂「技術奇點」是指在未來的某個時期，當機器達到「強人工智慧」時，其智商將超過人類，從而對人類社會造成巨大的衝擊。　　而自稱美國未來學家的庫茲韋爾則在他2005年出版的《奇點臨近》一書中，把「技術奇點」進一步轉述為「奇點理論」。他寫道：「2045年將出現『奇點』時刻，人類文明走到終點，生物人將不復存在，取而代之的是一個叫做『奇點人』的新物種。」　　霍金也對人工智慧表示極度擔憂。他說：「人工智慧開發成功將會是人類歷史上最大的事件。但不幸的是，這可能也會是最後一個大事件。」去年，霍金還與特斯拉創始人伊隆·馬斯克、蘋果計算機共同創辦人史蒂夫·沃茲尼克等數百名頂尖精英發表聯署公開信，表示人工智慧對人類生存的威脅更甚於核子武器。　　霍金認為，特別是高科技軍事裝備的普及，如美軍在戰場上大量使用無人機遠程殺敵，或多或少印證了這種憂慮。　　不過，人工智慧研究者則認為，這多半屬於杞人憂天。陳天石告訴南方周末，「阿爾法狗」雖然展示了非凡的才能，但人工智慧不大可能像人們想像的那樣進步神速。早在上世紀八十年代，人工神經網路的演算法基礎就已經基本構建好，但那時處理器的運算能力上不去，使人工神經網路的威力不能完全發揮。「阿爾法狗」的成功展示了計算系統（即處理器晶元）運算能力的進步。　　「隨著晶元摩爾定律的終結，處理器晶元的運算能力不再高速增長，人工智慧也很可能會進入一個瓶頸。」陳天石說，「我們距離真正的強人工智慧還差得很遠，也許五十年，也許一百年，或者更久。」　　「阿爾法狗」的支持者們認為，今天我們不僅無需為人工智慧感到擔心，反而應該感到高興。　　李開復指出，基於深度學習的人工智慧，未來將創造更多價值，包括更準確地計算投資回報率、個性化的精準醫療、搜索引擎更貼近的推薦結果等等。　　目前，哈薩比斯正同英國政府合作，利用人工智慧提高英國全國醫療服務體系的效率。人工智慧也會讓手機軟體更個性化，成為使用者的貼心助手。他預計，市場會在四五年內看到這類產品。　　當然，倫理問題可能是人工智慧目前面臨的最大困局。加拿大溫莎大學哲學研究者馬塞洛·戈里尼表示，只有徹底解決倫理方面的問題，人工智慧才能取得實質性進步。　　隨著越來越多的汽車廠商開始研發無人駕駛汽車，學者們對無人駕駛汽車遇到緊急情況時的處理方式給予了極大的關注。2015年5月，由華盛頓智庫布魯斯金學會舉辦的一次論壇上，有人提出，為保護自己或乘客，汽車突然剎車該如何規避後車碰撞，或者，汽車為規避行人而突然轉彎又如何避免撞倒其他人？　　參加這次論壇的德國西門子公司工程師卡爾·庫恩認為，研究人員應該研發能在「二個壞主意」之間做出正確選擇的人工智慧。
推薦閱讀：

※梁文道：世界上最有名的地址(南方周末 2007-7-5)
※離開。
※有態度的新聞是好新聞嗎？還是需要客觀？
※2012 年 8 月 4 日，南方周末 Think+ 北京分享會有哪些精彩內容？
※如果我說，從小我是看著鄭淵潔，日本動漫和鳳凰衛視長大的，是不是意味著我註定在大陸孤獨？

TAG:南方 | 南方周末 | 周末 | 阿爾法狗 |