為什麼谷歌人工智慧擊敗圍棋冠軍這事如此重要?
AlphaGo擊敗圍棋冠軍的消息在朋友圈刷屏了。從昨天夜裡到今天,你的朋友圈是不是被谷歌的人工智慧擊敗圍棋冠軍這條消息刷屏了?就在谷歌發表《自然》雜誌的封面文章後, Facebook人工智慧實驗室相關人員隨即嗆聲:恭喜谷歌,但這是我們先做到的。從兩個科技巨頭對人工智慧擊敗圍棋冠軍的重視程度上,可以判斷,這是人工智慧發展史上了不起的挑戰。那麼人工智慧在人機對戰中贏得勝利究竟有多重要,可能得從人工智慧的發展說起了。Alpha Go是如何做到戰勝歐洲冠軍的?先來看看谷歌的人工智慧是怎麼擊敗圍棋冠軍的。根據1月28日《自然》雜誌的封面文章介紹,谷歌DeepMind公司設計的AlphaGo在沒有任何讓子的情況下以5:0 完勝歐洲冠軍、職業圍棋二段樊麾。DeepMind團隊表示,Alpha Go的關鍵在於使用人工智慧中的深度神經網路。在Alpha Go中有兩種不同的神經網路,第一種叫做政策網路(policy network),用來預測下一步;第二種叫做價值網路(value network),用來預測棋盤上不同的分布會帶來什麼不同的結果。 「簡單來說,DeepMind是通過讓機器學習做到的。按照以往的方法,人工智慧是外界輸入一個信息,計算機通過輸入信息與已有的信息聯繫,得出一個結論,是一種遞歸的方式。但現在DeepMind的做法是,我不告訴機器哪種演算法能得到高分,而是訓練它,通過學習和分析結果來判斷最優策略。這個過程已經開始類似小孩子學習知識的一種方式了。」復旦大學計算機與工程學院副教授邱錫鵬告訴澎湃新聞(www.thepaper.cn)。再通俗一點的說法就是,DeepMind先用已有的圍棋技巧來訓練AI,稱為監督學習(supervised learning),然後讓AI和自己對弈,通過深度學習讓其掌握如何贏得圍棋比賽的技巧。英國圍棋協會財務主管,也是樊麾與AlphaGo比賽的裁判托比·曼寧(Toby Manning)目睹了整個對弈過程。在接受國外媒體採訪時,他表示:「你甚至很難區分哪一方是人類,哪一方是計算機。在之前的很多軟體中,計算機下的很多步可能都很理性,但突然就會變得毫無頭緒,而在這場比賽中,幾乎看不到計算機與人類的區別。一個區別是時間的分配方式:樊麾下每一步所花的時間都要比AlphaGo更久,而AlphaGo的棋路也不像人類棋手那樣富有進攻性。它會非常冷靜地落子,而非積極地侵略領地或提子。」地平線機器人公司CEO余凱在自己的朋友圈稱,深度學習領域裡的各種進步,讓其興奮不已。因為從簡單多層神經網路在語音識別的突破(2011),到對空間展開的卷積神經網路在圖像識別領域的突破(2012),再到遞歸神經網路在序列學習領域(OCR,語音,機器翻譯,NLP)的進展(2014),再到基於深度神經網路的增強學習在計算機博弈和控制領域的突破性進展(2016),這個過程人類只用了5年時間。
人工智慧戰勝圍棋冠軍是一件里程碑式的事件。為什麼這事如此重要?理解了Alpha Go的人工智慧後,再來看看為什麼戰勝圍棋冠軍是一件里程碑式的事件。棋類遊戲一直被視為頂級人類智力的試金石。人工智慧與人類棋手的對抗一直在上演。1989年開始,IBM的「深藍」(deep blue)就常常能擊敗國際象棋大師了, 8年後的1997年,深藍首次打敗世界第一的國際象棋棋手加里 · 卡斯帕羅夫,開始統治國際象棋領域。2006 年,成為了人類在國際象棋的絕唱,因為自此之後,人類再沒有戰勝過最頂尖的人工智慧國際象棋選手。不同於國際象棋,圍棋每回合的可能性更多,共有 250 種可能,一盤棋可以長達 150 回合。同時,圍棋有 3*361 種局面,而可觀測到的宇宙,原子數量才 10*80。用人工智慧戰勝圍棋專業選手,按照技術的發展速度,一般認為至少需要10年才能實現。「為什麼我們要致力計算機圍棋?因為這是一個需要學習、模式識別、問題解決和規劃等技能組合在一起的技能。也是一個測試新的想法,機器學習、推理和規劃的好方法。」Facebook人工智慧實驗室主任Yann LeCun在自己的Facebook賬號上表示。Facebook人工智慧研究所研究員田淵棟在其知乎賬號上指出,圍棋難的地方在於它的估值函數非常不平滑,差一個子盤面就可能天翻地覆,同時狀態空間大,也沒有全局的結構。這兩點加起來,迫使目前計算機只能用窮舉法並且因此進展緩慢。目前,田淵棟在Facebook負責黑暗森林(DarkForest)項目,也是一個圍棋對弈項目。這個程序已更新到第三個版本,並在KGS伺服器上運營了一個多月,並取得了成人組第五的排名。這個排名意味著它已經成為全美國最好的前100名選手之一,也步入了世界最頂尖圍棋機器人之列。贏了歐洲冠軍樊麾後,Alpha Go下一步的目標是在3月份挑戰圍棋世界冠軍李世石。對於這場世紀大對決,DeepMind公司創立者之一德米斯·哈薩比斯(Demis Hassabis)表示很有信心。他在接受《自然》雜誌採訪時稱:「AlphaGo很可能在圍棋這一領域超越最頂尖的人類,我非常期待看到它在圍棋的規則之內創造出新的東西。這是我親手打造的系統,自然對它懷有很深的感情,尤其考慮到我們打造它的方式——它會不斷學習,從某種意義上說我們是在不斷『訓練』它,它下棋的方式也很像人類。你在寫一段普通的程序時,可能對所有細節都了如指掌,事先安排好了一切,但AlphaGo不一樣,它會自己學習提高,這種能力是很了不起的。」關於AlphaGo的未來應用,哈薩比斯說:「最終,我們想要將這些技術應用到真實世界的重要問題中。因為我們用的方法是通用的,我們希望有一天,它們能延伸得更廣,幫助解決最緊迫的社會問題,從醫藥診斷到環境模型。」按照哈薩比斯的描述,這項技術在 Google 的首個用途將是開發更好的個人助理軟體。這樣的個人助理能夠從用戶在線行為中學慣用戶偏好,並對產品和事件作出更符合直覺的建議。利用人工智慧來做私人助理,這與Facebook首席執行官馬克·扎克伯格之前的想法又不謀而合了。
推薦閱讀:
※科學適量地使用護膚品很重要
※「年齡大小不重要,能滿足我就好」
※你若安好,是否晴天不重要【情感美文】
※男人的一生,尊嚴很重要!