如何看待柯潔將於 5 月底與 AlphaGo 進行的人機大戰?這對圍棋、人類和人工智慧會有什麼影響?
柯潔年內將和"阿爾法狗"進行圍棋終極人機大戰
進入圓桌 ? 人機對弈終章,參與更多討論。
去年三月,李世石面對阿爾法狗,賽前大家一致的看點是:「阿爾法狗能否贏一局?」。現在一年多過去了,當柯潔站到阿爾法狗對面的時候,情況已經發生了很大的變化!大家一致的看點是:「柯潔能否贏一局?」這一年中,首先李世石被阿爾法狗4:1擊敗,更震撼的是今年初的時候,阿爾法狗化身master,在各大網站對弈平台60:0橫掃中日韓各路高手,這其中固然有快棋規則,並且各路高手倉促迎戰的客觀因素,但是這60盤棋的內容中並沒有發現阿爾法狗明顯的失誤,這已經很說明它強大的實力了。
而最新版本的阿爾法狗,不僅集近千年來人類棋手所有武功秘籍於一身(所有的棋譜),更是在這個基礎上發展創新出了自己的武功門派,五月底的阿爾法狗,將比今年初的master更難對付!面對如此強敵,柯潔將如何應戰?
「先撈後洗」是值得嘗試的戰術:
介於圍棋AI的弱項是死活和局部計算,製造出大型死活和對殺場面是有機會戰勝阿爾法狗的途徑之一。而「先撈後洗」的戰術是很有可能製造出大型死活和對殺場面的。 見上圖:這是柯潔最近的一盤實戰對局,此局執黑的柯潔先把四個角全部收入囊中,然後在中央耍大龍,最後大龍不僅活了,還順勢把白棋下方的陣勢沖的七零八落,從而一舉制勝!
攻擊,是圍棋對局中尺度最難把握的環節,攻狠了,很可能落空;緩攻呢,很可能失去戰機。而防守的一方則不需要太多糾結,只需哪有空子哪有漏洞就往哪鑽即可,相對比較輕鬆。所以攻擊的一方不僅需要強大的技術能力,更需要決斷的魄力和勇氣!有時候到了關鍵岔路的抉擇,該殺大龍就得果斷殺上去!當年圍棋大師藤澤秀行殺另一位大師坂田榮男的大龍就是這麼露骨殺的!見上圖。
阿爾法狗雖然功力深厚,但是它除非萬不得已,不然不會輕易的下決心去殺對手的大龍。 如果說,「殺大龍」是阿爾法狗迫不得已的被動底線,那柯潔可以考慮利用這一點做文章,利用這個有利的談判籌碼多爭取利益。再說了,阿爾法狗的死活肯定存在問題,就算它忍無可忍孤注一擲的殺大龍,沒準自己就把自己給殺崩了。
客觀的說,柯潔戰勝阿爾法狗的幾率不會超過百分之十,但沒準,柯潔就是能把握這百分之十機會的人呢?人類心靈的能動性本來就能帶來奇蹟。5月23日—5月27日,柯潔能否出奇制勝?讓我們拭目以待!
個人原創文章《我們還沒準備好和AI共生——柯潔和AlphaGo大戰之觀後感》,近4000字,關於柯潔和AlphaGo、關於通用人工智慧,關於人和AI的共生,都有討論,歡迎交流。
端午節修整歸來,集中看了十幾篇柯潔和AlphaGo「人機大戰」的文章,感覺我還能分享些不一樣的東西,希望能進一步的拋磚引玉吧。
人機大戰,勝負已分;但其意義不止於勝負,而在「驚醒」二字。
一、驚醒:棋藝
人類對於圍棋的認知,還有大幅提升的空間嗎?各種所謂「定式」,真的是唯一最優解嗎?
當人類小夥伴已很難貢獻新的腦洞時,AlphaGo來了,源源不斷輸出刺激棋手獲得靈感的「機洞」。
關於圍棋本身的解讀,推薦曹政caoz老師的2篇文章
1、《是的,柯潔輸了,然而又怎樣。》
詳見:http://dwz.cn/63nVaX
2、《人機大戰第二盤究竟發生了什麼》
詳見:http://dwz.cn/63nXjV
這裡我總結了4點:
1、第一局柯潔輸了1/4子,但其實是巨大的差距。因為看似AlphaGo領先越來越小,其實勝率越來越高,直到最後1/4子的優勢,你卻絕對找不到任何翻盤的機會。
2、第二局,柯潔逼出了「目前」人類能夠讓AlphaGo展現的最強實力。這是AlphaGo與人類的所有對局裡,棋譜最完美的一份,詳見《人機大戰第二盤究竟發生了什麼》里的描述,非常精彩!
3、但是,人類還沒有逼出AlphaGo的極限。只有AlphaGo自己和自己下,人類才能知道,究竟它是否擅長官子,以及在逆境下會有怎樣的表現。
4、但是但是,AlphaGo也還沒有逼出圍棋的極限——並沒有完全征服圍棋。這部分內容,推薦看微軟亞洲研究院鄭宇博士的解讀:《人機大戰客觀剖析與認識》http://t.cn/RSJcMzt
二、驚醒:AI
正如柯潔所說,「我的改變只是小小的改變,但DeepMind團隊是改變世界。」
Deepmind發明AlphaGo,並不是為了贏取圍棋比賽,而是想測試其人工智慧平台,最終「把這些演算法應用到真實的世界中,為社會所服務」。
怎麼理解這句話?需要去看源頭——推薦大家詳細看看Deepmind創始人、AlphaGo之父哈薩比斯(Demis Hassabis)近日在母校英國劍橋大學做的一場題為「超越人類認知的極限」的演講,詳見:http://dwz.cn/63nZ14
簡單概括說,
1、Deepmind想做「通用人工智慧」。而不是僅能在某個特定領域發揮作用的人工智慧應用。
2、圍棋是一個靠直覺而非計算的遊戲,而AlphaGo是在嘗試「用計算擬合直覺」。具體說就是,通過深度神經網路,來模仿人類下圍棋這種直覺行為。
在這樣的背景下,Deepmind團隊在看比賽的角度和心態和我們是不一樣的。比如,「其實(AlphaGo和李世石比賽)第一局,我們非常緊張,因為如果第一局輸了,很有可能我們的演算法存在巨大漏洞,有可能會連輸五局。但是如果我們第一局贏了,證明我們的加權系統是對的。」
在3:0戰勝柯潔之後,Demis Hassabis宣布AlphaGo 將從棋壇「退役」,「烏鎮圍棋峰會是它(AlphaGo)作為一個競技程序所能企及的巔峰。因此,此次峰會將是 AlphaGo 參加的最後一場賽事」。
從現在開始,AlphaGo 的研發團隊將把精力投入到其它重大挑戰中,研發出高級通用演算法,為科學家們解決最複雜的問題提供幫助,包括找到新的疾病治療方法、顯著降低能源消耗、發明革命性的新材料等。
當然,未來Deepmind可能還會帶來一次全民討論的事件,人機大戰 in《星際爭霸2》。去年,DeepMind 就已宣布《星際爭霸2》將會是AlphaGo 在圍棋之後,想要征服的下一個目標。
但是,有2個問題:
1、烏鎮圍棋峰會,是AlphaGo作為一個競技程序所能企及的巔峰嗎?
2、「用計算擬合直覺」這條路徑,是否能創造出「通用人工智慧」呢?
正如前文提到的,AlphaGo還沒有逼出圍棋的極限。鄭宇博士也提到,我們不要低估了人類後天的快速(小樣本)學習能力,如果把AlphaGo開放出來,人類和她對弈次數更多,人類是有機會的。因為「如果還是基於現有的學習體系,即便再給AlphaGo一億副棋譜,再添加一萬塊GPU,它進步的速度也終將放緩,因為新增的棋譜和計算資源相對於2*10171這個搜索空間來說只是滄海一粟。」
如果AlphaGo不玩兒了,以後哪個AI繼續來幫助人類提高呢?目前看,可能是騰訊的圍棋AI「絕藝」。caoz文章提到「絕藝目前的水平肯定不如現在的AlphaGo V25版本,但明顯優於最早戰勝圍棋歐洲冠軍樊麾的AlphaGo V13版本,與去年戰勝李世石的AlphaGo V18版本,業內的人認為是可以相提並論的。」
基本上,目前的AlphaGo,很可能並不是圍棋AI所能企及的巔峰。
那如果未來騰訊「絕藝」結果AI這一方的接力棒,那人類這邊的領軍人物會是誰呢?
可能還會是柯潔。
柯潔去年說能夠戰勝AlphaGo,今年變慫,是因為他當時針對的是舊版本的AlphaGo V18,但今年的AlphaGo V25版本,已有了完全碾壓舊版本的進步優勢(大約讓3子)。
如果有人認為柯潔太狂妄,是沒有深入去看柯潔的心。
caoz文章提到,柯潔狂妄的幾次基本都兌現了,比如一次說「李世石只有5%機會」,一次說要「讓井山裕太血濺五步」,一次說「農心杯還要靠我」。
狂妄是什麼?狂妄是自己水平很次、也不知道對手水平幾何的時候說大話。且不說圍棋世界冠軍,只要是圍棋高段位的職業選手,可能都沒有狂妄的。學圍棋,很多都是從4、5歲開始,每天12個小時,一周7天,天天鑽研。心浮氣躁之人,是受不了這些的;真正狂妄之人,說話時會趾高氣揚,柯潔不是那個模樣。
柯潔不是狂妄,那是什麼呢?真實。
他是真的看到「李世石只有5%機會」,他是真心覺得「農心杯還要靠我」。就像AlphaGo和李世石比賽直播時,所有做即時點評的嘉賓職業棋手裡,只有柯潔的形勢判斷一直是最準確的。也許,現在柯潔真的已在人類朋友圈裡獨步天下了。
但他和以前的那些超一流棋手,還多了一份單純的「真實」。
他能夠把自己看到的「一覽眾山小」之境,說出來。這並不是因為他「敢於」說出來,因為在他心裡,很可能本就沒有「敢」或「不敢」的念頭。就像當別人讚歎微信懂得「克制」的時候,張小龍會略顯驚訝的感慨,本來不就應該這樣嗎?真正能做到這個境界的人,並不是在「用力」的調整心念,而是本來就處在那個狀態。柯潔能夠說出那些看似狂妄的話,很可能反而是因為,他內心有真正的平等。
但是,要想和AI繼續在圍棋領域絕代雙驕般的互相提升,有No.1的棋藝和真實,還不夠,在柯潔真實背後,還有一個關鍵,「心性」。
大家可以看看柯潔的微博,他的文字之中,有一種靈動的東西,但又不止於90後的逗比搞笑可愛,怎麼描述呢……有一種味道。有些東西很難用文字表達了,大家可以看這個短視頻,是去年柯潔點評李世石和AlphaGo的第二局棋,他自己拿手機拍的,大家就當娛樂放鬆一下吧,很有意思的:
史上最負責任的圍棋點評:阿爾法圍棋VS李世石第二局_騰訊視頻v.qq.com視頻
感興趣的同學,還可以去他微博圍觀粉絲點評:http://sina.lt/eX3S
雖然柯潔說這次是他最後的3盤人機大戰,但我個人還是希望,有一天他能帶來人類的首勝。
再說第2個問題,「用計算擬合直覺」這條路徑,是否能創造出「通用人工智慧」呢?
個人觀點是:
1、短期來說,「用計算擬合直覺」是現階段人類能採取的最佳路徑,但還不能創造出真正的通用人工智慧。
2、可能10或20年之後,人類能直接「用直覺實現直覺」,但這需要更本質的突破,比如結合量子力學,比如有更深入的超越圖靈停機問題的認知,等等,不過這是另外一個話題了,先打住。
3、「用計算擬合直覺」,現階段是非常非常好的,但現階段的目標,也許最好不是直接創造出一個「通用AI」,而是能夠和人協作的「通用輔助AI」。因為「AI+人工」很可能是未來很長一段時間內、實際場景中的AI產品形態。
也就是說,以前是用計算做計算,現在是用計算做直覺,未來可能是用直覺做直覺。
三、驚醒:人心
下棋是很快樂的事情。有的時候我太在意勝負了。前一天晚上我是真的沒睡好,我很緊張。我一直在想用什麼招數去對付AlphaGo,哎,庸人自擾。我希望以後下快樂圍棋。我可能跟人類下棋能感受到快樂。跟AlphaGo下棋我特別痛苦,他實在是太冷靜了,沒有一絲獲勝的希望。
這是柯潔自己說的一段話。
所以,其實AlphaGo也在刺激我們重新認知「人」本身,比如,什麼是真正的價值和快樂。
對於下棋(甚至所有事情)來說,如果快樂是戰勝別人,那是很危險的。就像我以前玩遊戲(實況足球或者dota),輸了,想再來一盤爭取贏,贏了,也想再來一盤繼續贏,但不論輸贏如何,過後都是空虛。
做事業最厲害的人,往往都是好勝心極強之人。不論下棋、習武還是創業。基於他們本身的福報和智慧,有的人能夠非常成功。
但是,我們往往會混淆結果和快樂的關係——結果和快樂,其實是兩個維度的事情。
有結果,是因為曾經播下了種子,並且有不斷的灌溉、陽光……。而快樂,是擁有結果之後的副產品,但在沒有結果的時候,有的人也生活得非常快樂。
這說明什麼?這說明在快樂背後,有其生成機制,「結果」只是助緣之一,非必要,非充分。所以,如果我們想追求快樂,不應該一味的去追求結果,而應該挖掘快樂背後的機制和源頭。
如果有一天,柯潔不僅在和人類對弈時發現快樂,也能在和AI對弈時體驗快樂,那他不僅是離圍棋的奧義更近了一步,也是更深的找到了自己。
四、驚醒:共生
AI已來到人類世界,但我們還沒有準備好和她共生。
當柯潔被AlphaGo擊敗後,下棋的繼續下棋,研究AI的繼續研究AI,那我們普通人呢?好像沒什麼特別的變化,該幹嘛幹嘛。
但是,這類事件,今後還會不斷的出現,總有一天,我們會不得不直面2個問題:
1、AI是什麼?
2、我們如何跟AI相處?
先引用一段AI領域真正的思想者、《哥德爾、艾舍爾、巴赫:集異璧之大成》(GEB)這本AI奇書的作者「侯世達」的話——
現在主流的研究雖然很厲害,但卻與真正的人工智慧沒有半點關係。……我們沒有致力於開發實際的應用,諸如翻譯引擎、問答機器、網路搜索軟體此類的東西。我們只是在努力地理解人類概念的本質和人類思考的根本機制。我們更像是哲學家或試圖探究人類心智奧秘的心理學家,而非旨在製造聰明的計算機或機靈程序的工程師。我們是一群老派的純粹主義者,我們的動力源於內心深處的哲學好奇心,而不是製造實用設備的慾望。
現階段,人工智慧領域(特別是國內),不論在技術還是產品角度,幾乎都沒有特別重大的突破。「過於把AI當作一個工具」,可能是其原因之一。
我甚至聽說,有一些歐美人對於AI的理念是,如果對於AI的本質說不清楚,那就先把她造出來再說。——如果屬實,這是非常可怕的想法。
對於AI的本質,我曾經在200頁PPT《人工智慧產品經理的新起點》(點擊可下載)中初步分享過個人觀點:
相較於Brain-like,或Baby-like,我理解AI是Original AI: New Species,即,原生/本來的AI,是一個新的物種——
她承載了人類探索自我極限和天人關係的載體——一個雖然從人類意識生出,且必須和人類交互/共生,但又獨立於人類的、具備自主意識的新物種形式。
如何我們希望AI能幫助到人類、不傷害人類,那我們在創造她之前,首先需要清楚,我們自己希望如何跟她共生。
這裡,分享幾點最近的認知,希望能拋磚引玉:
1、不是讓AI完全模擬人。人類直接繁殖就可以了……
2、不僅是實現比人更強的能力。比如計算。
3、更需要發揮AI的獨特優勢 剝離某些人不希望在同類身上看到的東西。比如,人在自私角度,都希望有事時我找你,永遠在線、立即回復;但沒事時,特別是我很煩的時候,不要來找我……。
如果能更好的認知AI,如果能更好的認識自己,我們才能更好的和AI共生。
注1:AlphaGo相關活動信息(in 北京)
分享題目:《人工智慧如何打敗圍棋第一人柯潔?AlphaGo的前世今生》
分享人:Martin Muller【AlphaGo的主要研究者David Silver和黃世傑(Aja Huang)的導師】
時間地點:6月4日10-11點,清華東主樓103會議室
詳情可見:點擊這裡(打開速度有點慢)
注2:本周日(6月4日)下午,我將在「人人都是產品經理/起點學院公開課」上分享《從互聯網PM到AI PM》,地點在北京中關村,感興趣的同學可以點擊鏈接:線下活動報名 | 產品汪的自我修養,聽老司機的產品往事
注3:點擊-hanniman的飯糰「轉型人工智慧」,有另外一片世外桃源……
---------------------
作者:黃釗hanniman,圖靈機器人-人才戰略官,前騰訊產品經理,微信公眾號/在行/飯糰ID「hanniman」,分享人工智慧領域的原創乾貨。
這是我最新的文章《我們還沒準備好和AI共生——柯潔和AlphaGo大戰之觀後感》,不知道柯潔是否有可能看到……也歡迎各位一起交流,關於圍棋和AI, @胡耀宇 @高飛龍 @范廷鈺
作為當代頂尖的棋手,看到史上最強的圍棋機器,想和它下幾局棋不是很正常的一件事么
我覺得這和什麼人類尊嚴關係不大,柯潔就是單純地想要下棋而已
畢竟柯潔可能是最後一個和阿法狗下棋的人了,和這樣的高手切磋的機會以後也不多了
結局並不重要2017年賽前更新:以下回答是去年寫的,已經過時了。請參看我最新的回答,或者頂樓胡耀宇老師的答案。
---------
首先是最新的官方闢謠。顯然中國棋院尚未和DeepMind方面達成哪怕是初步的協議。
然後,我認為這一仗還是會打的。當年深藍和國象大師們的比賽也不止一場。年內開戰的可能性還是很大。
在此前提下,建議各位不要對柯潔抱以過高期望。
以下消息只是道聽途說,還請各位自行判斷是否可靠:
據一位不願意透露姓名的職業棋手說,他們(柯潔在場)通過討論,一致認為,(五番棋)中,柯潔贏下一盤,含金量就高過拿下一個世界冠軍。
做出如此判斷的依據也不難猜測。古力九段此前在微博上透露過一些信息,十有八九是參與了阿爾法圍棋的測試。另外有職業棋手看到過未公開的阿爾法的棋譜。種種跡象表明,職業棋手已經對阿爾法老師的強大實力完全達成共識。
贏下五番棋固然有難度。但是贏下其中一盤棋,應該還是可以期待的。我認為,只要是柯潔拿白棋的對局,都是有機會的,而且這與阿爾法的進步無關。
如何看待柯潔表示 AlphaGo「贏不了我」? - 不會功夫的潘達的回答
在DeepMind不對阿爾法做大刀闊斧改動的前提下,阿爾法自身的判斷力越強大,其執黑時越是有可能走出激進招法。執白者只需不犯錯或少犯錯,就有機會取勝。
或許對於圍棋界以外的吃瓜群眾,這場對決不如李狗大戰引人注目。但對於圍棋界,還有柯潔本人,這絕對是重要性遠超世界大賽的一場比賽。微博宮老師@慶豐棋聖木可三吉 認為「贏一盤保本,贏兩盤就是圍棋史殿堂級人物。」 我現在要更悲觀一點,我認為一局勝利也足以載入圍棋史。
最後一點,關於柯潔的狀態,個人認為不成問題。由於與本題關係不大,不在這裡展開闡述。
----
針對問題回答吧。
首先,如何看。
我的看法是,這場比賽的意義並不如李世乭那場。雖然柯潔對李世乭戰績這一點穩穩壓著對手,但他們倆終究還是一個層次的選手。所以這場對決無非是讓alphago再玩一次罷了。它的意義更在於谷歌對中國市場的需求,讓這場比賽為自己在中國做一個更大的廣告而已。預測勝負的話,我只能說,按照我的想法,換誰也下不過alphago。
再就是對圍棋,科技,人類的影響。
對圍棋的影響肯定會有,其影響其實已經顯現了。人機大戰後的幾次比賽,頂尖選手的下法都發生了不同程度的改變,下一次對決,人類可以從機器上學到更多的東西。
至於對科技,人類的影響……對李世乭那場已經把該影響的都影響完了,就跟我前面說的那樣,這更多的是廣告賽。
本棋渣湊了個熱鬧圍觀了下第一盤。說實話趕緊打升降賽讓子吧,平子不可能有機會的。整個局勢的發展和年初的master 60局如出一轍,百手以內確定勝勢,之後AlphaGo一直在「穩健地退讓」,送子啊,讓對方聯絡活棋啊,各種損官子,硬生生把大優損成了小勝。說實話後半盤都不用咋看了,精彩的手段基本全在前半盤,AlphaGo一旦確立勝勢就開始放水。不知道AlphaGo對自己是否也是這種風格?我知道DeepMind公布過5局AlphaGo的自戰譜,裡面好像也有比較激烈的攻殺。
另外求高手鑒定下AlphaGo比年初的master進步了多少?我一位朋友的觀點是AlphaGo可能因為overfitting而提升餘地不大了。
該來的終於來了。
一年前AlphaGo發布,看完論文後我就在知乎上發文預測機器會完勝人類。好些行業朋友不相信,為此我收了很多「智商稅」,之後微信發紅包一直發到春節才發完。此外我還立了兩個斷言:一個是Google很有可能再研發出AlphaGo 2.0,擺脫「監督學習」,不再需要人類下圍棋的歷史數據,而是只通過「增強學習」,兩台AlphaGo自我對戰學習如何下棋,並達到登峰造極的地步。從公開的資料判斷,此言中了。這意味著什麼呢,又有什麼看點呢?
技術重大提升:和1.0原理大不同 更接近於人
AlphaGo 1.0 是巧妙地混合了三種演算法:蒙特卡洛樹搜索+監督學習+增強學習。其中蒙特卡洛樹搜索是一種優化過的暴力計算,比1997年深藍的暴力計算更聰明。而這裡的監督學習,是通過學習3000萬步人類棋譜,對六段以上職業棋手走棋規律進行模仿,也是AlphaGo獲得突破性進展的關鍵演算法。而增強學習作為輔助,是兩台AlphaGo從自我對戰眾中學習如何下棋,據悉對棋力提升有限。
根據公開資料推測,此次AlphaGo2.0的技術原理與之前有著巨大不同:
1. 放棄了監督學習,沒有再用人的3000萬局棋譜進行訓練。這本是AlphaGo最亮眼的演算法,也是今天主流機器學習不可避免的核心條件:依賴於優質的數據,在這個特定問題下就這麼被再次突破了。
2. 放棄了蒙特卡洛樹搜索,不再進行暴力計算。理論上,演算法越笨,就越需要暴力計算做補充。演算法越聰明,就可以大大減少暴力計算。從AlphaGo 2.0的「馬甲」Master的歷史行為看,走棋非常迅速,約在每10秒鐘就走棋一步,如此速度很可能是放棄了暴力的計算。
3. 極大地強化了增強學習的作用,之前敲邊鼓的演算法,正式成為扛把子主力。想想看有多勵志:兩台白痴機器,遵守走棋和獲勝規則,從隨機走棋開始日夜切磋,總結經驗,不斷批評和自我批評,一周後終成大器。
在這樣的演算法下,AlphaGo 2.0對計算資源開銷極小,把當前棋局輸入神經網路,電流流過,輸出就是最佳的走棋方案。我猜測如此演算法下,有可能僅僅依靠一個GPU工作,每一步棋消耗的能源接近人的大腦。
最大看點: AlphaGo2.0 棋風完全脫離人類經驗
今年年初,AlphaGo 化身Master連勝人類頂尖棋手60局。在圍棋領域,機器完勝已經變成公認的定論。這導致很多人開始問:這次人機大戰還有意義嗎?我們的關注點不再是機器是否會贏——而是機器將用什麼姿勢戰勝人類。
AlphaGo學習了3000萬步人類棋譜,走棋風格也近似於人。在比賽現場,偶有AlphaGo走棋和人的經驗不符合,就被評為「愚蠢」,只是在中盤之後發現機器漸漸局面佔優最終獲勝,為了自圓其說解讀為「AlphaGo中盤逆轉」,前兩局莫過如此。第三局開始評論者長了教訓,開始尊稱AlphaGo為「阿老師」,有了欣賞和敬畏的心態。這帶給圍棋界很大的衝擊,以前大家認為正確的東西,其實是不正確的。柯潔曾經評價說:「AlphaGo出現,很多理論都被推翻,再看以前定式變得好笑,虧那麼多目就不再是兩分。」人類通過數千年實戰,總結了圍棋理論,然後計算機告訴人類:這些全都是錯的。現在在很多比賽上,人類棋手已經開始向機器學習,模仿AlphaGo的下法,棋聖聶衛平也曾表示「理論被顛覆了」。
而AlphaGo2.0脫離了機器對人模仿,走棋風格也將完全脫離人的定式。在與柯潔的比賽中,會不斷出現我們意想不到的走棋,而且這些走棋在教科書中會被認為是低級錯誤或者完全不可理喻,但凡一個正常的棋手都不會這麼玩,但凡一個新手這麼玩都會被點撥這樣不對。而AlphaGo2.0會不斷製造這樣的局面,關鍵他還是對的。可想對專業棋手的心裡會有多大的震撼:不僅自己這一輩子都沒這麼想過這麼下棋,整個圍棋界都沒有想過。會不會懷疑自己白活了?會不會反思兩千年圍棋的發展為什麼有這樣的瓶頸?還有多少海闊天空等著我們去探索?可等不及我們去探索,計算機就給出了終局的答案,多麼惆悵。
我們會津津樂道,AlphaGo是什麼棋風。但可以這樣推理:但凡有流派和風格,就還有局限性。只有當所有流派合一看不出流派的時候,才到達致高境界。AlphaGo 2.0便會是這麼一台機器,沒有風格,穩如磐石。
可以想見這次與柯潔的對弈,能頻現「怪招」,完全顛覆人類對圍棋的理解——這會是比賽最大的看點。英勇的柯潔,要解鎖108種姿勢來抵擋了。
2017人機大戰的意義:重演一部進化史 重新認識智慧的邊界
2016年在AlphaGo和李世乭的對戰後,人工智慧進入大眾的視野,我們開始重新思考機器和人的關係。
圍棋已經有兩千多年的歷史,在漫長歲月的琢磨中,圍棋理論不斷進化,到達了很高的水準,AlphaGo的獲勝,我們大可以解讀於「青出於藍」,畢竟是在人類圍棋進化的主路徑上又攀高峰。
而AlphaGo2.0完全拋棄掉人類這兩千年來進化的圍棋經驗,另尋他徑,僅憑兩台機器自我對弈中學習和進化,最終不僅趕超了人類進化的速度,還發展出一套截然不同的下棋方法,並且更加接近完美的狀態,實現了對人類的碾壓,重演了一部圍棋的進化史,而且得出了與這兩千年來不同的進化結果。
這會給我們什麼啟示?如果跳出圍棋的規則,類比看地球生命的進化:人類是從原始的有機物,到單細胞開始逐步變成靈長類動物,並且發展出超越其他一切生物的智慧。這條路徑是唯一的么?人類的生命形態和最頂級的生命形態還有多大距離?AlphaGo告訴我們:我們還有極大的發展空間;AlphaGo2.0告訴我們:如果有合適的條件,完全可能有其他的生命進化路徑,以及更不一樣的進化結果。
讓我們歡呼人的智慧造就了AlphaGo,這也幫我們開了眼界,看到我們離最終的生命形態和智慧依然有遙遠的距離。
保持敬畏,堅定前行,終得圓滿。
-----------
事後他們發布會講,AlphaGo 2.0確實是單機版了,大大減少了暴力搜索,這點對了。但仍然還有人類知識的訓練,並沒有做到「開創新的路徑」,我過於樂觀了。
為了拯救即將廢部的圍棋部,少年決定,成為偶像!
相對「AlphaGo vs 李世乭」的五番棋,這次對決比較純粹就是下棋而已。論影響力、論看點都不及上一次,甚至很可能是遠遜。視柯潔的人氣情況可以找補回來一點,但也就是很有限的一點而已。
為什麼這麼說呢?在與李世乭的五番棋後,無論是職業棋手還是愛好者群體,其中絕大部分人事實上已經認可了AlphaGo有壓倒性的實力。柯潔對李世乭戰績顯赫,但兩人終究也就是一個級別上的對手,其地位並不像當年國際象棋的卡斯帕羅夫一樣。這也就意味著:絕大部分關心此事的人默認了柯潔會輸。當一場比賽被認為懸念不大時,其最大的看點消失,影響力自然會下滑,這基本是於各體育賽事皆準的真理。
在其他次一級的看點方面,比如「AlphaGo的下棋方式」、「AlphaGo會不會打劫」等已經得到了相對充分的展示。而且可以預見,AlphaGo在對陣柯潔時,這些方面也不會出現巨大的變化,意味著新鮮感肯定有所消退。在此前最大的幾個看點都淡化甚至消失的情況下,不如就把這當成一次普通的棋戰來看更好。
看點上我比較關心的,首先肯定是柯潔能否再次找到bug甚至致勝,另外就是人類頂尖離「圍棋上帝」還差多遠。後面這點基本意味著讓子棋,如果真的發生了我會很感興趣,但恐怕幾率渺茫。
這場對戰之後對各方面有什麼影響呢?
對圍棋:AlphaGo與柯潔的比賽必然會第一時間成為棋手們的學習或參考模板,但至於能否促進棋界整體水平提升就很難了解。如果通過與AlphaGo的比賽,能讓棋手們知道自己和「理論最強」還差多少,那影響就非常大,因為這樣的話一個穩定版本的AlphaGo足以成為衡量棋手實力的標杆。如果不行,那主要的價值也就是留下棋譜了,影響雖然也不會小,但相對有限。
對科技:了解有限。但就我所知,贏柯潔和贏李世乭對人工智慧領域來說沒有任何區別,對科技界影響更是無從談起。除非柯潔能贏,那另說。
對人類:這個就真的想多了,不如用這精力想想晚飯吃什麼。在座專註於討論結果的各位根本就搞錯了這場比賽的目的。
這場比賽的真正目的並不是決出人類和人工智慧的勝負(當然我認為九成還是AlphaGo贏,畢竟它不斷進化)。此前李世乭的對戰已經宣判了人工智慧在圍棋領域的勝利,再來一場也意義不大。就算柯潔贏了,世人的看法也不會因此大逆轉,大家都意識到了AlphaGo的進化之力,這次贏不贏根本無所謂。
對於谷歌來說,是為了向世人展示人工智慧的進化速度,增強世人對AI的正面看法,也為其它AI的發展鋪路,還能贏得一波投資。
對於柯潔代表的圍棋界來說,這場比賽一方面是擴大圍棋的影響力,用柯潔的話來說就是「拯救日益衰弱的圍棋界」;另一方面,也是柯潔作為最強也是最後一個有資格與AlphaGo對戰的棋手,必須面對的比賽。
比賽結果不重要,重要的是柯潔作為圍棋意義上「人類最後的尊嚴」的戰鬥。我一直認為柯潔有著遠超他年齡的思考與擔當,不論輸贏與否,這場比賽本身就讓柯潔成為一個值得尊敬的人。
謝邀!
對圍棋界的影響應該是最大的。從職業棋手從李世石五番棋中收穫的東西看,再來五盤棋一定同樣是五個寶庫。
不用上升到人類的高度
柯傑就是真心想要試一試阿法狗厲不厲害而已這天比賽開始前,柯潔默默的將黑白棋子有序的擺在棋盤上,看似是在打譜,所有人都不知道他在幹什麼。
此時已經進化出人工智慧的alphago好奇的掃描了一下
「這是。。。。。二維碼!看看裡面有什麼,咦,xx衛士是什麼,這個xx管家又是什麼,唔,能加快開機速度!還能自動清理內存!還能殺木馬!很有趣的樣子啊,安裝一下試試」
這天,人類再次戰勝了alphago!!!
這一次的人機大戰,對圍棋界、人類,和人工智慧的影響恐怕都要遠遜於一年前阿法狗對戰李世石的世紀之戰。
如果說一年前五番棋,還只是人工智慧對圍棋領域的一次試探,試探以圍棋界的驕傲和輕蔑開始,到阿法狗驚人的4:1結束。那麼,這一次的人機對決,就只是是AI對於人類智力最高領域——圍棋——被徹底攻克的一次公開宣告。
2017年年初,阿法狗的網路馬甲Master已經橫掃棋壇,以快棋的方式,吊打各路圍棋職業高手,以60勝0負1平的不敗戰績為本場大賽奠定基調。圍棋界早已預測比賽的結果會是柯潔難求一勝,坦言如果贏下一盤,也會是歷史性的一勝。博彩公司為柯潔開出了1賠8的賠率,這樣的賠率,大概和世界盃預算賽期間,中國男足擊敗韓國隊的賠率相仿。
這些天比賽的結果,也確實印證了大家的猜測:首盤柯潔在維持了前期短暫的均勢之後,盤面急轉直下,賽後自己也表示「輸的毫無脾氣」。第二盤柯潔帶來了幾乎完美的一局,但中盤因為左下角驚天大劫的劫材計算失誤,最終中盤戛然而止。第三局開局不久,負責講解的聶衛平棋聖已經表示:「要我說,阿法狗已經贏了。」隨後的進程柯潔苦苦支撐,做出了各種嘗試,始終沒能找到逆轉的手段。
這一場人機大戰,幾乎涵蓋了圍棋領域的全部對戰形式。從與柯潔一對一的慢棋番棋對決、到人機相互配合的聯棋、再到中國五位中堅棋手的相談棋聯手對抗,從賽果看來,人工智慧已經顯示了全面的掌控性。
而從人類的角度看來,這場人機對決的意義或許在於:這是人類在圍棋領域面對AI最後爭取一勝的最後衝刺,雖然幾乎一定會失敗,但從柯潔的角度看來,這也許是夢寐以求的去窺視「圍棋真理」的一次寶貴機會。
由於此前阿法狗在比賽中,一旦處於優勢地位便傾向穩健獲勝,甚至不惜走出一些損棋。導致棋界對阿法狗官子階段的實力,一直不甚了了。這場比賽里,人們會更多關注,人類,能在多大程度上逼出阿法狗的真正實力,甚至,能不能如同去年李世石的神之一手,直接逼到電腦錯亂崩盤。
從這幾句的結果看來,效果並不好,幾盤棋沒有一盤需要靠官子技術決定勝負。第三局電腦走出了損一點的招數,在場解讀的俞斌九段直接表示:「電腦不屑於跟我們爭這點小東西。」第一局中盤落後原本明顯,但在人工智慧阿法狗漫不經心的收官中,也僅僅以半目獲勝,對於這樣細小的差距背後體現出來人工智慧的隨意,聶衛平棋聖賽後的評論是:看著揪心。
以聶老為代表的圍棋界精英,在一年之前,還對圍棋界即將面臨的困境一無所知。然而當時,科技界的風向卻與圍棋界截然相反。
科技界的包括創新工場李開復、搜狗CEO王小川之內的大咖,一年前便表示了對人工智慧的樂觀。王小川高調預測AI將5:0獲勝。並後來宣布AI最終獲勝的一日定為「狗勝節」,公司全員放假一天。李開復甚至撿起了在知乎荒廢已久的賬號,寫下長文表示了對AI的樂觀;在那時的新浪圍棋直播室里,王小川點評:「機器贏了不可怕,如果機器開始假裝輸給你,那就可怕了。」
這裡思考的,是機器是否具備自主意識。千百年來,我們一直把人類的造物當成服務人類的工具,工具在人類的指揮使用之下,完成人類的意圖。
短期之內,人工智慧應當還無法進化出這樣的思維,但是,在5月26日略帶娛樂性質中的人機配合戰中,有一個細節值得玩味:
人機配合戰中,兩位國手古力和連笑,分別與一隻阿法狗組隊,人機攜手相互對抗。棋局臨近結束,古力一方面臨劣勢。與古力配合的人工智慧經過冷靜判斷,認為翻盤無望,主動要求認輸。在古力拒絕後,人工智慧開始胡亂走棋,最終古力不得不同意機器的判斷,推枰認負。
在微博段子手的演繹里,這一段阿法狗的表現被描述成「你不聽我的我有小情緒了呢」這類賣萌景象,然而深思下去,這是一次工具對工具主人的拒絕。工具開始否認人類的判斷,並要求人類按照工具規劃的更加理性更加正確的道路前進。
正如之前的車輛自動駕駛技術,當車輛發現犧牲車主可以保全更多人安全時,可能選擇放棄車主的的演算法,也同樣引起了網路上的恐慌和熱議。
在這個基礎上,或許真有一天,會發展到「假裝輸給人」。然而我總覺得,機器會故意輸,這還不夠可怕,真正可怕的是——
機器故意贏。
一個用故意贏,來掩蓋自己「具備故意輸的能力」的人工智慧,恐怕就更細思恐極。
還好,目前看來,「故意贏」的AI還只是我無聊之餘的小小腦洞。從目前看來,人工智慧與人類對圍棋的理解,還是屬於兩個不同的次元。
也同是今年年初,在圍棋荒漠的比利時,一款可以在家用機運行的圍棋人工智慧「麗拉」Leela被公布下載。這一款軟體多次獲得KGS計算機圍棋大賽冠軍,已經接近職業水準。作為棋力水平低下的普通愛好者,我自己下載後多次感受,每一次都遭到吊打。
有趣的是,Leela在傳統的19路棋盤之外,又提供了了25路的大棋盤模式,複雜程度遠遠超過普通棋盤。剛剛被虐過的我,懷著朝聖的心態,執黑棋和Leela下了一盤,想窺視一下更大棋盤上的「圍棋真理」。然而,竟然發現,原本在普通棋盤上,一個人類棋手掌握的很容易遷移到大棋盤上的招數,電腦卻視而不見。最後我吊打電腦,電腦的白棋局勢非常難看:
這也意味著,複雜度提高之後,電腦的計算依然不如人類的棋感。人類在漫長歲月里進化出來的經驗遷移和觸類旁通的能力,依然是電腦所不能及。人類在於人工智慧面前,我們依然還有自己的優勢。
從Leela在25路棋盤上的表現,也說明,人類依然是把圍棋當成圍棋,而電腦,就只是在解數學題而已。柯潔棋下的好,做數學題做不過電腦,倒也沒有什麼好遺憾。
不過,機器的演算法和拆解速度的發展都一日千里,根據deepmind團隊放出的預測,即使是今年年初的阿法狗master版本,實力也已經達到了讓擊敗李世石的初代機三子的程度,如今對陣柯潔的版本又經歷了幾個月的迭代,實力只會更勝從前。在柯潔首度交手之後的評論里,對阿法狗棋力的評論是「已經接近圍棋上帝」。我們並不知道我們的驕傲還能保持多久,人工智慧也即將迎來爆髮式的發展。唯一需要懷疑的,只是AI超越人類的時間節點到底是遙遠的未來,還是就在不久之外。
前面說到科技界大咖對這一次圍棋賽事再度展現出熱情,王小川再次接受媒體的邀請,與聶衛平棋聖共同點評棋局,談及對人工智慧未來的遐思。李開複發布了《AI技術處在黃金時代》的演講,甚至指出「全世界90%的工作會被人工智慧取代」。還專門跑到知乎開了Live,講《在未來,我們如何與人工智慧相處》。
科技界的大佬長期對此保持熱情,可不僅僅是因為他們熱愛技術、擁抱人類未來。而是——主義的背後往往存在生意,他們與人工智慧領域存在利益關係:去年7月,李開復的創新工場已經投資了25家人工智慧公司,投資額接近了一億美金;早在去年4月,王小川的搜狗在清華投資兩億,致力於人工智慧領域的研發,甚至搞出來一個汪仔機器人,送去參加答題節目;騰訊的「絕藝」團隊,雖然實力遠遠遜於谷歌,但也開發出了中國國產的圍棋AI,棋力已經超過了九段棋手的平均實力,目前在野狐圍棋上,「絕藝」AI的段位被註明為十段。
與他們對比,在人工智慧領域沒有利益相關的馬雲,對本次人機大戰就不太感冒。在論壇公開表示 中國企業搞AlphaGo這些東西沒多大意義。「下圍棋本來多有樂趣,結果機器從來不下臭棋,快樂都沒了,有啥意思?」
對人工智慧有所準備的科技公司,早在此前很久便已經發現了這一次風口,並投下重金,這一次的勝利與否,對技術本身的影響反而不大。
但毫無疑問的是,這將吸引媒體的關注和社會的矚目,並最終拉高相關公司的發展前景和市場估值。我們這種普通人,倒是可以考慮搶在本次大賽結束後不久,投資一些AI領域有所布局公司的股票。
The end
利益相關:觸寶矽谷大數據和人工智慧實驗室數據科學家
今天第二局比賽結果也出來了,柯潔因為失誤中盤就主動投子認輸了。結合上一局,看似柯潔只以1/4目的劣勢「惜敗」,但實際上AlphaGo完全處於統治地位。AlphaGo的學習目標(也是實戰時的行動目標)是最大化贏棋的概率,而並不是將贏多少目最大化。所以可以認為他是一個永遠淡定的總是求穩的棋手,即使有機會大勝也不會去冒險。所以柯潔有一種「輸得沒脾氣」的感覺。實際上如果AlphaGo稍微冒險一些,可能可以贏得更多,只是他寧願最小化風險。
從目前公開的材料看(主要是Aja Huang博士的發帖和Demis Hassabis、David Silver的問答記錄),AlphaGo 2.0 (還是稱做"AlphaGo Master", 雖然對之前網路上60戰全勝的Master可能又有改進)有如下一些改進:
- 使用了40層的神經網路作為模型,相比與李世石對戰時的AlphaGo Lee (V18),增加了28層。增加了那麼多層的神經網路顯然讓AlphaGo的學習特徵的能力有了更大提升的空間。另一方面, DeepMind團隊有沒有引入新的原始特徵,有沒有嘗試使用LSTM等模型去處理一些特殊場景,我們要拭目以待他們後面陸續發布的結果。
- 更依賴於大量自我對弈的結果,用上一代訓練好的神經網路的對弈結果去訓練下一代更強的神經網路。相比上一代(AlphaGo Lee) 更少地依賴人類的對局數據。 所以「AlphaGo 2.0已經擺脫了監督學習,不再需要人類下圍棋的歷史數據,而是只通過增強學習」 是不準確的。AlphaGo仍然需要在最初的階段通過學習人類棋局來達到一個相對比較高的水準,然後再自己左右互搏,否則會產生爆炸性數目的價值不大的學習樣本。
- 改進了演算法:更強大的策略網路和價值網路,並發現在這個場景下演算法比數據重要。我們都知道上一代AlphaGo是結合了監督學習訓練出來的策略網路、增強學習訓練出來的價值網路、蒙特卡洛樹搜索演算法三者的一個精巧設計的對弈引擎。但是由於圍棋的搜索空間實在太大,即使這樣的引擎跑在Google的計算集群上也遠遠無法在規定時間內找到最優解,因此雖然上一代AlphaGo已經很牛了,但還是有非常大的提升空間。DeepMind團隊從上次AlphaGo和李世石的對弈中尤其是輸的那一局中獲得了很大的啟發,相信他們在策略網路和價值網路的訓練上又有了新的突破。非官方的渠道我們了解到DeepMind特意開發了一個程序專門尋找AlphaGo的弱點或者盲點,通過刻意和AlphaGo對弈這些存在弱點或盲點的棋局幫助AlphaGo在這些場景下學習。還有一個猜想是引入了一些機制來對獲勝概率預估的可靠性進行了建模,把預估的不確定性作為一個考量因素放在落子決策裡面,這樣可以使得AlphaGo更加穩健。
- 更快的計算速度,據稱因為演算法的改進,AlphaGo現在只需要上一代1/10的運算量。這次的AlphaGo 僅僅運行在一台TPU的單機上 。運算效率的提升實際上潛在地是在同樣的時間限制內獲得了探索更多解的可能性,這樣AlphaGo就能遊刃有餘地去探索一些需要更深的地方,比如原來「手下一著子,心想三步棋」,可能就可以心想五步甚至更多的棋了。
同樣從目前公開的材料看,王小川老師的回答不是完全準確的。首先,DeepMind團隊已經明確說監督學習在這一代的AlphaGo還是使用了的。其次,「放棄了蒙特卡洛樹搜索,不再進行暴力計算「也只是他個人的猜想,官方的介紹中並沒有提到這一點。我的猜想是樹搜索還是要做的,但是因為訓練出了更強大的策略網路和價值網路,需要使用隨機布局(rollout)的搜索空間被大大減小,甚至直接用策略網路的輸出就可以達到很高的棋力。到底這一代AlphaGo有哪些令人意想不到的演算法改進?DeepMind團隊已經承諾在近期的論文中會公之於眾,讓我們拭目以待。
回到題主的問題,所以這次柯潔和AlphaGo的人機大戰應該沒什麼懸念了,實際上正如雙方以及很多人預測的一樣。與其說是一場比賽,不如說是人類對技術和極限的卓越追求。從DeepMind的視角,打敗人類棋手早已在Master 60連勝時早早奠定,這次和世界排名第一的柯潔正式約架,是想在大家那麼認真的情況下看看AlphaGo是否還有弱點,未來如何改進。從柯潔和人類棋手的視角,集中精力、控制失誤、計算速度等等方面可能都比不上機器內心的AlphaGo,那麼這一戰也就是為了看看人類的極限在哪裡。
AlphaGo與柯潔的這一戰,對圍棋影響也許很大,但未必深遠。確實棋手們從AlphaGo的走子中學到了以前不曾想過的套路。在這一波針尖對麥芒的較量之後,或許很少會有機器再去下圍棋,圍棋界也會重歸平靜繼續三國爭霸。
但這一戰對人工智慧研究來說是一個具有很大實際意義的象徵性意義。為什麼這麼說呢?其實AlphaGo所使用的模型和演算法是早已成熟的,DeepMind團隊在一個合適的時間把這些演算法通過精妙的設計整合起來去完成下圍棋這樣一個非常具體的、有明確約束的任務。從這個角度看,AlphaGo的「成功」(擊敗人類最好的圍棋選手)實際上只是一個象徵意義很大的事情:對老百姓來講,聽說電腦能把世界上最厲害的圍棋選手殺到「輸得沒有脾氣「,應該說是很震撼的。那麼正因為這麼大的一個象徵意義,也給人工智慧研究帶來了很大的實際意義:社會的眼球被吸引過來了,資源也就彙集過來了,DeepMind團隊功不可沒。實際上,人工智慧早已在方方面面抑或是潛移默化、抑或是大張旗鼓地改變著人們的生活方式。例如在新聞資訊APP中看新聞時候的個性化推薦、家居中的智能生活管家、越來越方便貼心的虛擬理財投資助理等。在矽谷,大到Google, Facebook這樣的公司,小到2、3個人的創業公司,都在努力通過人工智慧改變世界。走在矽谷的街道上,經常能看到各個公司的自動駕駛汽車規規矩矩地在身旁停下來等紅燈。所以我們正在一個人工智慧快速形態化我們的生活的年代,AlphaGo的成功是這股浪潮中很耀眼的一個閃光點。
關於這些話題我和朋友同事們最近有不少探討,寫在了專欄里
https://zhuanlan.zhihu.com/p/27104462歡迎大家討論、批評指正。
1.如何看待柯潔年內將與 Alpha Go 進行的對戰?
如果要說這場對戰的結果,必然Alpha Go將會獲勝,這一點毋庸置疑。
原因如下:Alpha Go所具備的心智模式,是我們人類不具備的,也就是Deepmind團隊為其設定的學習模式和決策方式是我們人類無法達到的,雖然說我們中間一些天賦異稟的人經過一系列的訓練可以成為圍棋大師,具備類似的心智模式,但計算機能實現的程度是我們無法企及的。這不是我們能力不足,而是我們思考方式,學習方式的差異。
很簡單的例子,我們用計算器可以很容易算出來一些根號,三角函數的結果,但我們手算經過訓練也可以算出來,但速度,精確度會差的很遠。這不能說我們不如計算器,而是計算器就是為了補充我們這方面能力而生。
人工智慧也一樣。
2. 柯潔與 Alpha Go 對戰之後對圍棋界,科技和人類會有什麼影響?
對圍棋界的影響
這場對戰就是1997年IBM公司的Deep Blue與當年的國際象棋大師Garry Kasparov對戰的翻版。
那1997年之後,對國際象棋界有什麼影響呢?
1997年IBM公司的Deep Blue戰勝了當年的國際象棋大師Garry Kasparov,之後又舉辦了幾場比賽,結果無出其右,Deep Blue獲得全勝。
但人們並未因此消沉,Deep Blue出現的之後幾年中,下國際象棋的人數,參加大賽的人數都達到了歷史之最,並且人們下棋的方式有了改變,一部分人開始在人工智慧的協助下下棋,人工智慧會為當前要走哪一步提供建議,人們可以採納建議,也可以忽略建議而採用自己的決策下子,利用這種方式,世界上擁有了更多的國際象棋大師。
也許很多人如果沒有人工智慧的幫助根本不會涉足國際象棋領域或者成為國際象棋大師,僅僅考慮這一點,可以說人工智慧讓人類的能力獲得了提升,或者說,人工智慧為我們承擔了一部分思考,將更多精力留給我們思考關鍵的部分。
率先提出這種人+人工智慧(man-plus-machine)概念的就是當初被人工智慧戰勝的國際象棋大師Garry Kasparov。
因此人工智慧對圍棋界的影響也將是正面的,不會出現人們對圍棋比賽失去興趣的情況。
對科技的影響
通過對戰世界知名圍棋選手,人工智慧已經滲透到了大眾的眼中,關注它的人將會越來越多,這會帶動人工智慧領域的創新發展,而人工智慧領域的創新也將幫助彌補我們心智模式中各方面的不足,協助我們成為更優秀的人,從而進一步推動科技的發展。
對人類及社會的影響
人工智慧幫助我們的,是我們人類做不到的事情,並非僅僅某些方面比我們做的更好。就像工業革命至今出現的最重要的機械產品,是幫我們做到以前做不到的事情,將更多時間和精力留給我們讓我們在力所能及的事情上做到更好。
這樣看來,人工智慧也將帶來一場革命。
人工智慧所需要的條件已經完全成熟,互聯網,數據量和計算速度。並且人工智慧的目標是解放我們的大腦,相比於工業革命解放我們的雙手雙腳,人工智慧帶來大腦的解放必然引起史無前例的劇變。
CEO王小川覺得上次人機大戰自己預測神准,這次又推出三點預測,槽點太多,讓我說說一二。
順便說一句,預測對了,不代表你的技術觀點或理解是對的。
「技術重大提升:和1.0原理大不同 更接近於人」
什麼更接近於人,是「思考方式」?還是下棋的招數?
「最大看點: AlphaGo2.0 棋風完全脫離人類經驗」
什麼叫完全脫離人類經驗?好吸引眼球的說法。
「 在與柯潔的比賽中,會不斷出現我們意想不到的走棋,而且這些走棋在教科書中會被認為是低級錯誤或者完全不可理喻,但凡一個正常的棋手都不會這麼玩,但凡一個新手這麼玩都會被點撥這樣不對。而AlphaGo2.0會不斷製造這樣的局面,關鍵他還是對的。 」
以往很多會出現這樣的棋評,「這樣的招數如果是業餘棋手下的,肯定被罵,但是這是李世石下的,所以...」
換句話說,實際上「意想不到的走棋」,只是大多數人想不到,或者說是按照職業棋手的慣性容易忽略的一手(先不論好壞)。這世界上每天棋譜上都會出現一些「意想不到的走棋」,而且不壞,甚至效果很好,但是我們從來沒說這些人的棋風「不像人」。這世界上沒有不像人的招法,只有大多數人想不到的選點,AlphaGo的確經常會給我們展現這樣的招數,根本原因就是我們往往是靠棋理、推理來選擇,AlphaGo用的是統計學,選擇標準是看勝率。
第一局的48,50,54是相關的好手,綜合多個職業棋手當時的棋評來看,這幾手的確是容易忽略的好手,柯潔局後也對54表示讚賞。
1. 放棄了監督學習,沒有再用人的3000萬局棋譜進行訓練。這本是AlphaGo最亮眼的演算法,也是今天主流機器學習不可避免的核心條件:依賴於優質的數據,在這個特定問題下就這麼被再次突破了。
2. 放棄了蒙特卡洛樹搜索,不再進行暴力計算。理論上,演算法越笨,就越需要暴力計算做補充。演算法越聰明,就可以大大減少暴力計算。從AlphaGo 2.0的「馬甲」Master的歷史行為看,走棋非常迅速,約在每10秒鐘就走棋一步,如此速度很可能是放棄了暴力的計算。
3. 極大地強化了增強學習的作用,之前敲邊鼓的演算法,正式成為扛把子主力。想想看有多勵志:兩台白痴機器,遵守走棋和獲勝規則,從隨機走棋開始日夜切磋,總結經驗,不斷批評和自我批評,一周後終成大器。
今天5月24日David Silver公開了最近一年的技術進展,第1、2點明顯不成立,David Silver昨天5月23日第一局賽後發布會回答問題的時候就明確回答AlphaGo訓練早期還是需要人類棋譜的,等我看到清晰的PPT後再來補充。第3點,什麼叫扛把子主力,DeepMind放出的AlphaGo第一篇論文,很多人還對什麼是主力或者說什麼是程序主框架結構有不同的看法,沒有清晰的定義,第3點不值得討論。
David Silver演講內容看完了,雖不是譯文,但明顯證明王小川第1,2點預測完全錯誤
田淵棟博士在朋友圈說:
拿MCTS來bootstrap,這要多少資源啊……
你看懂了嗎?
唯一的意義也許就是讓我們看到AlphaGo的進步能有多快多大。
由於你不懂得原因,烏鎮這場AlphaGo和柯潔的對局變成了沒有直播的棋。無數互聯網站灰頭土臉地中斷或撤回了直播頁面,只剩下這個沒有視頻和解說的實時棋譜。也罷,觀棋不語真君子。
由於擔心AlphaGo已經有所準備,柯潔並未像之前戲耍絕藝那樣用模仿棋而是靠自身實力與AlphaGo全力周旋。但也想和某個互聯網巨頭一樣給自己化妝成AI基因的比特港覺得,柯潔太悲觀了。這場對決只是人類智能在機器輔助下提升的開始,而並非結束。只要AlphaGo敢公開在網上公開開放任人挑戰,人類棋手快速學習提高的機緣就來了。在幾個月或者幾周之內湧現出戰勝AlphaGo的人類棋手只是指顧間事爾。
就人工智慧或者人類智能向機器智能反向學習(AAI)而言,一切只是開始。
全文:一盤沒有直播的棋:柯潔稱這是最後的對局,且看且珍惜
我看到有一些答案說到人類尊嚴什麼的,但這些東西柯潔本人都沒有考慮呀,在人機大戰開始前三個月,也就是李世乭接受挑戰時,記者就對國內一眾世界冠軍進行了採訪,那時柯潔的回答是「如果機器贏了我,我還想再贏回來」這很明顯只是把人機戰當成切磋(或者重要程度再高點,當成某比賽的決賽)而已,關人類尊嚴什麼事?可惜彼時圍棋受關注太少,有關這個採訪的新聞有多少人看到了?柯潔那時說的話又有多少人看到了?大多數人只看到了他在微博上說的話,有人認為狂妄,嘲諷他「一個武士向坦克進攻,企圖維護最後的尊嚴」,有人喜歡他的自信,也真把他當成人類最後的堡壘。但這些人,無論黑他的或挺他的,真是想太多了。柯潔約戰阿法狗,只是作為一個棋手向另一個棋手挑戰罷了。最後說一下我對比賽的期待:作為一個圍棋愛好者,我希望看到精彩的對局,而在兩個棋手之間,我更支持柯潔,就這樣。
推薦閱讀:
※如何評價吳清源的一生以及他對圍棋所做的貢獻?
※職業圍棋比賽中有哪些冷僻的開局?
※為什麼圍棋界有「二十歲不成國手,終生無望」的說法?
※如何看待聶衛平談 AlphaGo 約戰柯潔「比賽結果顯而易見,柯潔下不過,建議不比、不參加、不推廣」?
※AlphaGo 能戰勝李世石嗎?