標籤:

再進化的人工智慧阿爾法狗是怎樣煉成的?

再進化的人工智慧阿爾法狗是怎樣煉成的

我們都知道,阿爾法狗並不需要人類數據。也就是說,它從一開始就根本沒有接觸過人類棋譜。研發團隊在鍛煉它時只是讓它自由隨意地在棋盤上下棋,然後進行自我博弈,在自我的認可與否定中尋找最優選項,並學以用之。

「這些技術細節強於此前版本的原因是,我們不再受到人類知識的限制,它可以向圍棋領域裡最高的選手——AlphaGo自身學習。」 AlphaGo團隊負責人大衛?席爾瓦(Dave Sliver)說。

再進化的人工智慧阿爾法狗是怎樣煉成的

大衛·席爾瓦介紹,AlphaGoZero使用新的強化學習方法,讓自己變成了老師,進行自我學習。也就是說其實系統一開始甚至並不知道什麼是圍棋,只是從單一神經網路開始,通過神經網路強大的搜索演算法,進行了自我對弈。

再進化的人工智慧阿爾法狗是怎樣煉成的

AlphaGoZero還獨立發現了遊戲規則,並走出了新策略,為圍棋這項古老遊戲帶來了新的見解,這是團隊意料之外的發現,這也就證明,阿爾法狗在人工智慧的道路上能做到的甚至比想像中更多。

再進化的人工智慧阿爾法狗是怎樣煉成的

人工智慧未來究竟能發展到哪一步,無人能預料的到。



推薦閱讀:

OpenAI Gym 在windows下的配置和使用
人工智慧——Singleton模式
想去美國學人工智慧該怎麼選學校?這裡有一份詳細的指南
LeCun親授的深度學習入門課:從飛行器的發明到卷積神經網路
[中國電子學會]新一代人工智慧發展白皮書(2017)第一、二章

TAG:人工智慧 |