標籤:

Alphago就像人類的棋手一樣圍棋

1997年,IBM的深藍電腦擊敗了國際象棋世界冠軍加里·卡斯帕羅夫。對於人工智慧來說,這是一個重要的時刻,它展示了一個聰明的演算法可以在一個因智力問題而受到重視的遊戲中走多遠,但就在計算機科學家慶祝這一成就的同時,還有另一項挑戰更大的遊戲:古老的棋盤遊戲。簡單地說,圍棋有兩名棋手在19乘19的棋盤上交替使用黑白棋子。但這種遊戲的複雜性令人眩暈,它的棋盤位置比宇宙中的原子還要多

這就是為什麼掌握圍棋對人工智慧研究人員一直有特別的吸引力:即使是最複雜的演算法也遠遠比不上最優秀的人類選手。直到現在。去年年底,DeepMind發明了一個名為AlphaGo的自學程序,以5-0擊敗了歐洲圍棋冠軍范慧。本周在韓國首爾,AlphaGo正面臨終極挑戰:與世界上最優秀的圍棋棋手李世石(Lee sedol)進行五場比賽。(AlphaGo贏了第一場比賽。)對於人工智慧來說,這是一個非凡的時刻——就在去年,大多數研究人員和圍棋專家都認為,電腦要花上10年時間才能讓任何專業人士都能勝任。現在AlphaGo可以與頂級大師匹敵。

人工智慧研究社區在五年內取得了令人難以置信的進步。谷歌的研究人員已經把過去的理論機器學習變成了有形的有用的產品。一些影響是細微的改進:更相關的搜索結果,更嚴格的垃圾郵件過濾器,更好的視頻和應用推薦。但是機器學習也讓你做一些人們以前從來沒有做過的事情。谷歌的照片讓你可以在2013年讓你的手機在雪地里找到你女兒的照片,而它在幾秒鐘內就會出現。如果你拿著一個手機在俄語的標牌上,你可以得到一個即時的英語翻譯,用谷歌翻譯。在谷歌,我們開始教計算機自動識別詞類,理解句子的意思,識別手寫、圖像和視頻。

總的來說,一個關鍵的觀點是,讓計算機知道如何通過經驗來完成目標和改進,而不是為每一個單獨的任務手工製作指令。這也是AlphaGo成功的秘訣。我們首先訓練了AlphaGo的神經網路,它從人類遊戲中獲得了3000萬個動作,這樣它就可以學會預測人類專家將會做出什麼動作。然後我們更進一步,在成千上萬的遊戲中玩AlphaGo。這樣一來,它就可以通過從自己的錯誤中學習來發現全新的策略,這樣它就能比第一次學習的人更好地發揮作用。

這是否意味著如果AlphaGo獲勝,我們就輸了?當電腦在一場似乎代表人類智慧的遊戲中擊敗人類時,我們是否會被削弱?恰恰相反。世界上真正的挑戰不是「人類對機器」,而是人類和我們能夠集中的任何工具,以及圍繞我們的棘手而複雜的問題。無論是氣候變化、醫療保健還是教育,最重要的鬥爭已經有成千上萬的傑出的和有獻身精神的人在影響我們每一個人的問題上取得進展。

像人工智慧這樣的技術將增強我們應對這些緊迫的全球性挑戰的能力,提供強大的工具幫助專家更快地實現突破。我們需要機器學習來幫助我們馴服複雜性,預測不可預測的事情,並支持我們,因為我們實現了以前不可能的事情。當我們的工具變得更智能、更多功能時,我們有責任開始更加雄心勃勃、創造性地思考如何解決社會最嚴峻的全球性挑戰。我們需要抵制這樣的觀念,即有些問題是難以解決的。我們可以把目標放得更高。

我們誰也不知道誰將在本周的比賽中獲勝,這是激動人心的一部分。但是,從正面交鋒的興奮之情來看,考慮到下一代圍棋選手在他們的身邊是多麼的不可阻擋,想想世界上最好的氣候變化研究人員、臨床醫生或教育者可以用機器學習工具來幫助他們。真正的考驗不是機器能否打敗人類,而是人類和機器能共同克服的問題。

推薦閱讀:

如何看待AlphaGo Zero?AI會取代人類嗎?
柯潔與AlphaGo第二局的精彩看點 | 陳經
柯潔和阿法狗對戰之後,對柯潔的影響有多大?柯潔的棋力提升了多少?
絕藝奪冠——從AlphaGo到國產狗絕藝系列評論之一
如果允許悔棋,人類能在 100 年內下贏 Alpha Go/Master 嗎?

TAG:AlphaGo |