最強AlphaGo Zero出世, 自學成才無師自通, 柯潔: 人類太多餘了
文/前方智能 梟梟
(知乎號:前方智能)
柯潔:AlphaGo是最強的,人類太多餘了
AlphaGo又出來搞事情了!
今天朋友圈、各大科技媒體頭條都被新版AlphaGo——AlphaGo Zero(人稱阿爾法元)刷屏了。
這個AlphaGo Zero可厲害了!
AlphaGo Zero在誕生的3小時後,就學會了下圍棋。
在誕生36小時後,就打敗了它的「二哥」AlphaGo Lee——以100:0的碾壓戰績。
在誕生的第21天里,就打敗了60連勝的Master,Master後來在烏鎮戰勝了國際圍棋第一人柯潔。
在誕生的第40天里,AlphaGo Zero對戰Master的勝率達到90%,成為最強的人工智慧。
無需收集大量數據進行學習訓練,自學便成才,這樣的AlphaGo Zero,問你怕不怕?
對於這個問題,柯潔這樣看:
「一個純凈、純粹自我學習的alphago是最強的...對於alphago的自我進步來講...人類太多餘了[失望]」——柯潔。
隨後圍棋世界冠軍八冠王古力也跟著轉發柯潔的微博:悲傷地表示人類苦練圍棋20年不抵機器人的3天!
隔著屏幕,智能君都能深深感受到柯潔內心的無奈與悲傷~還有技不如機的挫敗感~在經過足夠的自我安慰後,可能才會有一絲絲關於科技進步的喜悅感~
心疼一下世界第一棋手柯潔~最大的敵人不是對面的活人,而是機器人。
AlphaGo Zero是如何讓人類變成「多餘」的?
兩個關鍵字:自學。
AlphaGo Zero完全是個自學成才的天才。
它可以完全脫離人類歷史棋譜,各種先輩們留下來的「技巧」、「心法」、「秘笈」等乾貨,它通通不需要!
如同它的名字AlphaGo Zero一樣,它一切是從零開始。你只需要告訴它圍棋規則,然後它便可以進行「自我對弈」~
自己和自己下棋,這很真實地詮釋了——「人最大的敵人是自己」這個真理。
而在2900萬次自我對弈後,AlphaGo Zero就成長為世界上最強大的圍棋大師,瞬間成了科技界的「網紅」。
但在人工智慧技術上來講,更令人咋舌的是:相比於以往的幾代AlphaGo,包括AlphaGo Fan、AlphaGo Lee和AlphaGo Master,AlphaGo Zero的學習成長過程竟是最簡單!
在AlphaGo Zero的自我對弈里,只使用一個增強學習的神經網路,然後就可以直接靠神經網路得出結論了。
不需要以前的「策略網路」和「價值網路」和 「快速走棋策略」,所以也不需要人類對它做出種種複雜的架構設計與數據輸入,不僅如此,它還不再被人類認知所局限,並能自己發現新知識,發展新策略。
這樣看來,在圍棋界,人類是多餘的~真是說得,沒毛病!
說真,好「簡單粗暴」啊~丟一個神經網路和下棋規則,供應電給它,40日後便自成大師了,果然真正的大師往往都簡單直接。
「通用」人工智慧要來了嗎?
感覺AlphaGo Zero更像人類,一樣先學習規則,然後能過不斷地練習,最後就學會了一項技能。
好厲害是不是!
但如果自學能力那麼強的人工智慧不局限在圍棋領域,而是放到其它領域,進行學習,那麼通用人工智慧是不是指日可待了?!
首先可以確定的一點是,AlphaGo Zero確實可以在其它領域發揮它的作用。
Deep Mind公司 CEO Demis Hassabis表示:
AlphaGo Zero的強大之處,在於它「不再受限於人類知識」。如果將之應用到大健康問題上,比如對阿爾茨海默病(AD)的治療上,它甚至可以在幾周的時間裡,拿出需要人類幾百年才能找到的治療方案。
並透露目前,DeepMind已經開始使用AlphaGo Zero來研究蛋白質摺疊,並承諾將很快發布新的發現。錯誤摺疊的蛋白質是造成許多破壞性的疾病的元兇,包括老年痴呆症、帕金森和囊性纖維化。
最重要的是,AlphaGo Zero能夠從空白的狀態學習,它自己成為「自己的老師」,能夠通過玩遊戲和自己對抗,每時每刻都在提高。它不需要人的知識、數據或任何干預。
另外,AlphaGo的首席研究員Dave Silver博士說:「如果你能達到白板學習,就相當於你有一個代理,可以從圍棋遊戲迅速移植到其他領域,把你自己從你所處領域的細節中解放出來。這是一個通用的演算法,它可以應用到任何地方。」
毫無疑問,AlphaGo Zero已經很強大,未來它可以應用在其它領域,但其實離通用人工智慧還是有一段距離的。
為什麼這麼說呢?
因為現在增強學習的神經網路還暫時只能在步驟可能性較少、任務行為較窄的領域發揮強大的作用。
它是有局限性的。
比如圍棋、簡單物理運動、某種疾病的治療方案、某種物質的研究等。
真實世界太過複雜了,存在太多的不確定性。比如相比於圍棋,機器想在玩撲克牌中打敗人類就沒那麼容易。
玩撲克牌可以隱藏自己的牌,其中有很多變數和不確定性,概率、以假象迷惑對手的心理層面因素、風險管理等在撲克牌中十分關鍵。似乎是撲克完全基於人類心理活動的方面令其在面對計算機時顯得無懈可擊。一台機器可以很容易地計算出每一手牌的可能性或者概率,但在面對低概率同時卻是高賭注的時刻,人工智慧卻並不佔優勢。
結語:
綜上所得,其實通用人工智慧還遠著呢!
關於各種強大、通用人工智慧的各種威脅論,大家也大可不用擔心。
但隨著AlphaGo飛速的進化,我們看到了人工智慧巨大的進步,也看到了未來通用人工智慧實現的可能性以及趨勢。
回想近兩年,人工智慧確實發展得非常快,無論是學術上的技術研究還是商業落地上的智能產品。
而AlphaGo Zero的進化與強大,更是給了所有人強烈的信心:
智能時代,終會到來。
號外
號外號外,智能君建了讀者交流(HB)群。更多黑科技新聞、福利等著你哦,歡迎加入!要入群的私信或者在本文下方留言給智能菌,暗號是:好好學習,天天向下~!(奸笑臉)
——————————————
更多人工智慧產業的新鮮資訊,歡迎關注前方智能的知乎,或者在微信關注前方智能(qianfangAI)~,也可以登陸我們的官方網站:前方智能丨有遠見的人都在看的媒體!
推薦閱讀:
※中國團隊再次稱雄AI大賽,微軟谷歌FB都甩在身後
※進擊的DuerOS,開發者的「新黃金時代」
※中國人工智慧技術蓬勃發展 | 張薩拉
※【西瓜書】周志華《機器學習》學習筆記與習題探討(一)
※為什麼小米MIX開始嘗試並未大量驗證的聲學技術?