標籤:

阿法狗這樣的程序能否被人工智慧打敗?

去年,阿法狗(AlphaGo)代表人工智慧在圍棋領域首次戰勝了人類的世界冠軍,但其棋藝的精進,是建立在計算機通過海量的歷史棋譜學習參悟人類棋藝的基礎之上,進而自我訓練,實現超越。圖為阿法狗棋藝增長曲線。

阿法狗這樣的程序能否被人工智慧打敗

人工智慧的一項重要目標,是在沒有任何先驗知識的前提下,通過完全的自學,在極具挑戰的領域,達到超人的境地。

阿法狗這樣的程序能否被人工智慧打敗

新一代的阿法元(AlphaGo Zero), 完全從零開始,不需要任何歷史棋譜的指引,更不需要參考人類任何的先驗知識,完全靠自己一個人強化學習(reinforcement learning)和參悟, 棋藝增長遠超阿法狗,百戰百勝,擊潰阿法狗100

阿發元演算法與之前的AlphaGo有兩個大的區別。

1.與之前將走子策略(policy)網路和勝率值(value)網路分開訓練不同,新的網路結構可以同時輸出該步的走子策略(policy)和當前情形下的勝率值(value)。

2.實際上policy與value網路相當於共用了之前大部分的特徵提取層,輸出階段的最後幾層結構仍然是相互獨立的。訓練的損失函數也同時包含了policy和value兩部分。這樣的顯然能夠節省訓練時間,更重要的是混合的policy與value網路也許能適應更多種不同情況。

由此可見,阿法狗能被打敗。人工智慧也會有一天打敗人類。

阿法狗這樣的程序能否被人工智慧打敗



推薦閱讀:

阿爾法狗再進化,不再受人類知識限制?
互聯網+上半場信息浮游,消費者如何在下半場拯救自信
人工智慧爆紅,能否成為聯想轉型的一支奇兵?
福布斯盤點21位AI領域的傑出女性,李飛飛吳華等在列
物聯網:Facebook人工智慧正在教機器人「討價還價」

TAG:人工智慧 |