阿爾法狗再進化是怎樣的?

早在今年五月對弈柯潔之前,AlphaGo就已經從「狗」進化為「神」,無需依賴人類訓練師,但谷歌的野心並不止步於此,Deepmind公司1/4精力已經被用於商業實踐和變現

阿爾法狗再進化是怎樣的

10月19日凌晨,谷歌旗下的人工智慧公司DeepMind在世界頂級科學雜誌Nature雜誌上宣布了AlphaGo的新進步,可以在沒有人類干預的情況下自我學習,新的AlphaGoZero在自我學習3天之後,就以100比0的成績戰勝了第一代AlphaGo。

自我學習能力的出現,對於人工智慧和機器學習來說,是一個新的突破。「過去人們普遍認為機器學習是基於海量的大數據,但是從AlphaGoZero身上,我們發現演算法比數據更重要。」AlphaGo項目的主要負責人戴維·席爾瓦(David Silver)說道。

也由於使用了更多的演算法和更少的數據,所以AlphaGoZero只使用了一台計算機器和4個TPU,被它打敗的一代AlphaGo則用到多台機器和48個TPU。

當人們驚訝於AlphaGoZero在圍棋領域的神級水平時,對於DeepMind團隊來說,這才只是剛剛開始,他們的目的是通過培養自主學習的能力,來解決更多其他領域目前無法解決的棘手問題。

阿爾法狗再進化是怎樣的

今年5月的比賽期間,DeepMind的多位高管就已經向《財經》記者透露,Master已經實現了自我學習能力,甚至有了自己的「直覺」,「我們發現AlphaGo已經不需要依賴人類訓練師了。」戴維·席爾瓦告訴《財經》記者。

與柯潔的對弈中,AlphaGo已經能下出很多人類棋手完全無法想像的路數,比賽後柯潔表示,第一代的AlphaGo還能找到破綻,Master已經實現了「從人到神」的飛躍。

阿爾法狗再進化是怎樣的

而AlphaGoZero在「獨立」上更進一步,在訓練的過程中,它是自我對弈。從訓練圖上可以看出,由於一開始並不熟悉圍棋,對弈雙方的水平都很弱,但是隨著時間的推進,在短短3天互相博弈490萬局後,越來越強,實現了圍棋水平的突破。



推薦閱讀:

人工智慧背後的數據科學
思維的革命-從 「機械性思維」 到「資訊理論思維"(筆記)
論人類圍棋水平的極限
中國腦計劃顛覆性創新之路九,進化的方向,突破達爾文進化論局限
【願景學城】24小時AI熱點新聞的匯總(2018/03/01)

TAG:人工智慧 | 阿爾法狗 | 阿爾法狗再進化 |