再進化的人工智慧阿爾法狗是怎樣煉成的？

03-30

再進化的人工智慧阿爾法狗是怎樣煉成的

我們都知道，阿爾法狗並不需要人類數據。也就是說，它從一開始就根本沒有接觸過人類棋譜。研發團隊在鍛煉它時只是讓它自由隨意地在棋盤上下棋，然後進行自我博弈，在自我的認可與否定中尋找最優選項，並學以用之。

「這些技術細節強於此前版本的原因是，我們不再受到人類知識的限制，它可以向圍棋領域裡最高的選手——AlphaGo自身學習。」 AlphaGo團隊負責人大衛?席爾瓦(Dave Sliver)說。

再進化的人工智慧阿爾法狗是怎樣煉成的

據大衛·席爾瓦介紹，AlphaGoZero使用新的強化學習方法，讓自己變成了老師，進行自我學習。也就是說其實系統一開始甚至並不知道什麼是圍棋，只是從單一神經網路開始，通過神經網路強大的搜索演算法，進行了自我對弈。

再進化的人工智慧阿爾法狗是怎樣煉成的

AlphaGoZero還獨立發現了遊戲規則，並走出了新策略，為圍棋這項古老遊戲帶來了新的見解，這是團隊意料之外的發現，這也就證明，阿爾法狗在人工智慧的道路上能做到的甚至比想像中更多。

再進化的人工智慧阿爾法狗是怎樣煉成的

人工智慧未來究竟能發展到哪一步，無人能預料的到。