Master沒學過人類棋譜?他可能比老阿法狗更恐怖
在Master完成60勝,結束人機車輪戰後,因與AlphaGo對戰而成名的歐洲圍棋冠軍樊麾就在社交網路上發表了一篇公告。
在這篇公告中,谷歌公司明確表示Master是「阿法狗」的升級測試版,而在其中更是有個驚人的所在——Master可能完全沒學過棋譜,而這也側面印證了Master不按常理出牌的套路。
柯潔微博。
人類與人工智慧共同探索圍棋?
樊麾目前是谷歌DeepMind團隊測試工程師,在公告中,樊麾代表DeepMind團隊寫道:
「我們最近很努力地開發阿爾法圍棋,剛過去的幾天我們在網路的對弈平台進行了一些非正式的快棋對局,目的是為了檢驗我們最新版本的阿爾法圍棋是否如我們的預期。」
「我們需要感謝所有與我們的Magister(P) 和Master(P) 賬戶在弈城圍棋網以及野狐圍棋網對弈的棋手,也要感謝所有觀戰的人!最新的阿爾法圍棋在對局中所富有啟發性的創新,我們從中可以學到的,以及對局的結果都令我們非常激動。」
谷歌團隊聲明。
在這段公告中還有耐人尋味的一段:
「世界冠軍古力與阿爾法圍棋對弈以後寫了,『人類與人工智慧共同探索圍棋世界的大幕即將拉開』。我們現在結束了非正式的測試,非常期望今年能有機會與圍棋組織以及專家共同探索神秘的圍棋,在相互啟發的氣氛中共同領會圍棋的奧妙。我們希望儘快發布其他公告。」
人類與人工智慧共同探索圍棋世界的大幕即將拉開?是的,谷歌看上去是要將圍棋AI領域探索作為一個重要突破口。
要知道,DeepMind公司創始人哈薩比斯此前在一次採訪中曾透露,他們的團隊正在嘗試訓練一個沒有學習過人類棋譜的人工智慧,這也可能就是Master和AlphaGo不同的原因。
如果Master真的沒有學習過人類棋譜,而有了突飛猛進的實力,那恰恰印證了谷歌AI技術的全新突破。
《自然》雜誌封面。
它的棋力哪裡是極限?
AlphaGo的棋力已經不言而喻,但更可怕的是它的學習能力。
在2015年10月,AlphaGo在與歐洲冠軍樊麾的對弈中就在公平的情況下以5比0完勝。樊麾在接受媒體採訪時認為,AlphaGo的可怕在於「從不犯錯」。
但在樊麾與AlphaGo的五盤大戰棋譜被放上網路後,就有不少圍棋業餘高手在網路上發表評論,其中不少人認為樊麾這次的棋下得並不出色。
但當時《自然》雜誌就寫道,「人類在下棋時有一個劣勢,在長時間比賽後,他們會犯錯,但機器不會。而且人類或許一年能玩1000局,但機器一天就能玩100萬局。」
「圍棋AI的學習能力非常強大,就像當初『深藍』第一次輸給了卡斯帕羅夫,但不到一年第二次對弈就贏了比賽。」
據《自然》雜誌介紹,AlphaGo的核心是兩種不同的深度神經網路:「策略網路」(policy network)和 「值網路」(value network)。它們的任務在於合作「挑選」出那些比較有前途的棋步,拋棄明顯的差棋。
更恐怖的是它的「進化」深度學習能力,用了2000萬局的對子對弈進行訓練,每一次都能提升棋力。
本文來源:澎湃新聞網 責任編輯:王鳳枝_NT2541
推薦閱讀:
※在未來,人類可以用CRISPR技術來做什麼?
※地球編年史紀年表 (人類的宿命)
※人類的進化起源是什麼?
※人類為何對貓如此狂熱