再進化的人工智慧阿爾法狗是怎樣煉成的?
03-30
我們都知道,阿爾法狗並不需要人類數據。也就是說,它從一開始就根本沒有接觸過人類棋譜。研發團隊在鍛煉它時只是讓它自由隨意地在棋盤上下棋,然後進行自我博弈,在自我的認可與否定中尋找最優選項,並學以用之。
「這些技術細節強於此前版本的原因是,我們不再受到人類知識的限制,它可以向圍棋領域裡最高的選手——AlphaGo自身學習。」 AlphaGo團隊負責人大衛?席爾瓦(Dave Sliver)說。
據大衛·席爾瓦介紹,AlphaGoZero使用新的強化學習方法,讓自己變成了老師,進行自我學習。也就是說其實系統一開始甚至並不知道什麼是圍棋,只是從單一神經網路開始,通過神經網路強大的搜索演算法,進行了自我對弈。
AlphaGoZero還獨立發現了遊戲規則,並走出了新策略,為圍棋這項古老遊戲帶來了新的見解,這是團隊意料之外的發現,這也就證明,阿爾法狗在人工智慧的道路上能做到的甚至比想像中更多。
人工智慧未來究竟能發展到哪一步,無人能預料的到。
推薦閱讀:
※OpenAI Gym 在windows下的配置和使用
※人工智慧——Singleton模式
※想去美國學人工智慧該怎麼選學校?這裡有一份詳細的指南
※LeCun親授的深度學習入門課:從飛行器的發明到卷積神經網路
※[中國電子學會]新一代人工智慧發展白皮書(2017)第一、二章
TAG:人工智慧 |