隨便聊聊AlphaGo Zero

AlphaGo Zero已經刷屏了。社會被科技新聞刷屏總歸是好事情,比被娛樂八卦新聞刷屏有意義的多。看了很多媒體的評論,大多是在鼓吹「人類多餘論」,直到周志華老師發聲,覺得才算真正看到了有獨到見解的評論。我將周志華老師的微博原文放在了本文最後。

在這裡,我認為最重要的就是:AlphaGo Zero進行的不是無監督學習!是有監督的學習,甚至可以說是非常強的監督學習。只不過監督信息不來自於數據,而來自於棋類任務天然具有的」強規則「屬性。但是,要知道,我們的世界中大多數問題和棋類遊戲相比,都不能叫弱規則了,說是沒規則都不誇張。因為在真實的世界中,新規則隨時會建立起來,舊規則也隨時會廢棄或者改變,各種規則以各種排列組合的形式被應用,有些規則甚至還能衍生出不同的解釋。在這樣的條件下,AlphaGo Zero的方式被真正有效地應用在我們的社會生活中還有多遠的路要走?很難說。

但我並不是說AlphaGo Zero沒有意義。相反,過幾年回頭看,AlphaGo Zero的意義很有可能比現在人們想像的還要大。2001年微軟研究院的一篇著名的論文向我們揭示了這樣一個事實:對於不同的演算法,他們雖然有優有劣,但當我們給它們輸入越來越多的數據以後,它們的表現都非常好,甚至沒有差別!這篇論文告訴我們:演算法或許並不重要,數據才重要。也就是說:或許數據即演算法。從此,大數據時代的帷幕轟轟烈烈地拉開了。

但是Google的這篇AlphaGo Zero的文章重新告訴我們:演算法依然是凌駕在數據之上的。只有高效的演算法才能將數據的功效發揮出來。甚至對於棋類遊戲這種規則屬性很強的任務,沒有數據都不是問題,演算法才是最重要的

在我看來,這對大多數人來說都是好事。因為這個事實再一次強調了人的主觀能動性的意義。人類絕不僅僅是機器的數據的提供源而已。人類更是演算法的設計者,創造者和生產者。

至於人類多餘論,科技的發展總是在取代人類的工作的,但與此同時也在創建新的工作。如果說機器威脅人類的話,那人類承受這樣的威脅已經有很長時間了。ATM取代了銀行櫃員的工作;自動販售機取代了售貨員的工作;電子郵件取代了郵局的工作;搜索引擎取代了圖書館的工作;自動化的農耕機械取代了農民的工作;現代化的車間設備取代了工人的工作...... 其實如果沒有機器,現在的人類社會已經很難運轉了。但是要注意,在我舉的這些例子中,與其說是」取代「,不如說是」輔助「更合適。與此同時,由於這些機器的使用,大量新生的,更富創造力的,同時也能帶來更多社會收益和財富的新工作和新方向源源不斷地湧現了出來。

現在問題來了,未來的新工作和新方向到底是怎樣的?其實關於這方面的分析很多。籠統的,具體的,我覺得有道理的,沒道理的,已經撒滿了互聯網。不過這篇AlphaGo Zero的論文告訴了我們一個更加具體的方向。

我相信:增強學習在未來會越來越火的:)


個人原創文章,未經授權,嚴禁轉載,如有違反,必究法律責任。

我的更多文章,歡迎大家關注微信公眾賬號:是不是很酷

推薦閱讀:

這些崗位將永遠消失,他們何去何從?
Scalers:「第一反應」決定了我們的前途命運
Sam Altman: YC、矽谷與人類未來的天選之子?
寫給未來自己的一封信

TAG:人工智能 | 未来 | 算法 |