AlphaGo 與李世石的第五局比賽中有哪些值得關注之處?
本題已收錄至知乎圓桌 ? 對弈人工智慧,更多關於李世乭對戰人工智慧的解讀歡迎關注討論。
-----第五局比賽,李世石九段惜敗 AlphaGo。相關問題:? AlphaGo 與李世乭的第四局比賽中有哪些值得關注之處? - 人工智慧
? AlphaGo 與李世石的第三局比賽中有哪些值得關注之處? - 人工智慧
五盤結束了,不知道有沒有出乎大家的預料。
這五盤棋進行的時間是我不斷學習提高的過程,新事物的強烈衝擊果然是人學習的重要動力來源。可能很多棋迷也像我一樣很久很久沒有動機從頭到尾仔仔細細研究過一盤棋了。 (如圖,大戰樊麾,李九段以後Alphago的等級分已經打到世界第二了,嘖嘖 )這次對抗真是陰謀論橫行,已經到了見縫插針的地步。陰謀論什麼時候都有,歷史上很多事比陰謀論里寫的還要黑暗的多,但是沒有證據沒有獨立分析拿出腦殘的陰謀論去忽悠別人,忽悠自己就是非常不理智的行為了。世界上各種事情其中背後原因的可能性實在太多,如果都做有罪推定,生活就太累了。)
四盤講完以後還有很多人問,棋牌上人工智慧贏了不是很正常么,為什麼要和舉重機比力氣、和計算器比算數、和人工智慧比數據分析呢?因為現在的計算機其實和人類一樣,完全沒有辦法窮盡圍棋里複雜的變化。人學圍棋的方法是大量的積累棋譜庫和鍛煉計算力,比賽的時候根據經驗計算,在一定情緒氛圍內,用邏輯進行判斷之後做出決策。Alphago是什麼樣呢,他的本質是大量的隨機落子總結哪些勝率高,然後把局部特徵總結出來備用最後與估值網路的判斷結合分別評分之後落子。
就這次比賽而言,就如我之前反覆說的,看點就是足夠強大的硬體在依靠勝率分析而沒有邏輯判斷的系統和人的邏輯判斷為主的系統優劣如何。從這五局的結果來看,缺乏邏輯支持會有一些愚蠢低級的失誤,不過總體的表現還是非常棒的。這五局比賽對於李九段來說,壓力顯然非比尋常,這五盤作為人類一方的代表,被關注的程度和比賽的意義超過了作為任何一國的主將參加任何一次世界大賽。全程的關注程度爆表不說,還有攝像頭無時無刻的近距離追蹤拍攝,在這種情況下李世石九段頑強拼搏的斗魂精神如同璀璨的星辰,閃爍在棋壇穹頂之上。
(Alphago已經拿到韓國棋院名譽九段稱號,韓國棋院這招好快好厲害)
【對棋手想法的影響】這次比賽完以後,很多棋手表示看到了圍棋更迷人的地方,不論如何,在圍棋技術上,Alphago帶來了更為廣闊清晰地思路,提供了更好的訓練方法和判斷參考。相信Google在圍棋上的探索只是小小一方面,這次比賽給人工智慧賺足了眼球,期待Google之後的大招。——————————————————————————————————————————下面還是重點講講棋局,感覺這盤棋李九段已經基本回到正常狀態,最後一盤已經很放得開,走的十分精彩。對於棋迷來講,Alphago經營全局的水平很高,像是打太極,從不起殺心,走得非常均衡。看點在於控制與均衡。【序盤】(緊跟時尚潮流的開局)
之前的開局,Alphago喜歡使用一些古老的套路或者自創的招法,這盤棋難得的使用了比較新的流行變化,碰一個感覺很有活力。第一次看到Alphago支持流行變化。
(序盤戰發端)進行到這裡是第一個分歧,如果退是平穩的下法,如果點或者夾擊則進入戰鬥。這裡李九段稍作猶豫,馬上點入,這裡是石頭典型風格。進行到下圖一番折衝之後,白棋轉身,黑棋右下實地很大,稍可滿意。左邊黑棋簡明定型之後,白棋立刻回到爭奪中央話語權的部署上來,思路很清楚。
最近幾盤Alphago總會走肩沖,李九段使出斗轉星移,以彼之道還施彼身。
可惜被白棋反鎮一個,這局部最後落了下風。這步棋其實棋迷們氣合的時候肯定都常用,不過運轉之後的變化的能力就差遠了。Alphago的走法柔和細膩,推手太極一般把自己處理的非常好:
進行到這裡,黑棋上面只活了三目,所得甚少,相比之下右上白棋模樣有近五十目的潛力,白花花一片,這種控制全局的能力,還是Alphago強大。(打劫稍重,黑棋未必好)
貼一張終局圖,按一般收束下完輸兩目半。(最後李世石微小差距落敗,人機大戰五盤棋中白棋贏了四盤,真有意思)
【小結】這一盤雙方都出錯了,相比之下,Alphago明顯的錯誤反而更多一些,很多時候我們都是這樣,贏了開心慶祝,總結勝招;輸了反躬自省,各種不對都來了。實在說,人與人對抗是比賽,人和機器對抗是測試為主了。很多人說找到Alphago的bug就可以讓他接連走出荒唐的招法,從而致勝,私以為從取勝的角度來講有價值,對於棋藝本身不是什麼好的做法。
對人的成長來說,勝利的甜頭固然重要,不過在人工智慧迅猛發展大的趨勢面前,用長遠的視角去分析去看自己該站的位置更為重要。即使這次李世石九段贏了,總有一天我們會敗在不斷完善的演算法上,對於圍棋界來說這一天可能來的比預想的早太多太多,但對於國際象棋等等棋類,二十年前就在思考這樣的問題了。
勝固欣然,敗亦可喜。有些思考的價值始終超越於勝負之上,超越於變化本身,神經網路幾十年前就有,到如今才初得大成。很多人喜歡簇擁在鮮花簇擁,富麗堂皇的場所之中追隨潮流和一個又一個熱點。越是這樣飛速發展,不斷變化的時代,越需要寧靜致遠,清晰冷靜的大局觀,不論是在棋盤上還是在人生中。(報告!Google帶著一大波分門別類的Alpha狗 正在襲來!求哪只最萌!)
第四盤比賽結束,讓人類好像經歷外星人入侵,把人類英雄踩在腳下,然後血泊中的英雄,瞬間崩發出神之一手,反戈一擊成功。好萊塢的典型煽情故事。
(圖片來自網路)
一瞬間,職業棋手都緩過來了,紛紛發賀電鄙視阿法哥。我選擇這樣一個安靜的環境下,在輕鬆的心情中細細品味最終一戰。今天我立場是支持圍棋棋道,不論勝負,給雙方選手都加油。
李世石今天心態很放鬆,可以從開始的時間控制看出來,李世石的布局也相當簡明。到了40,黑棋空多無弱子。(截圖是圍棋之眼,請不要再問了:) 但是我感覺,白棋像道策。看道策這盤,是不是幾分神似?黑棋左邊31的靠,記得是吳清源大師提倡過的簡明手段。大道至簡,也許這是圍棋的最高境界。
阿法哥右下就讓人鄙視了。業餘棋手都能看清的手段,硬是自己下死,花了代價學會了「大頭鬼」這個圍棋手段。我預感,如果阿法哥輸了,它會受到各方職業棋手的鄙視。「發力點根本不對啦,根本不會下棋」等。
70是阿法哥卓越的中腹感覺,感覺黑棋下得有點保守,最後三目活。應該是心理出現波動,想贏怕輸。解說的麥克雷蒙這段冒出一句話,李世石估計在想,前三盤是怎麼會輸給這個那麼low的阿法哥啊,那可是100萬美元。此時,局面已經很細微了,甚至白棋潛力巨大。
阿法哥下到100,第三局大師風采又來了。黑棋得拼搏了。但是中間弱棋還沒治理,不得不要揮師左下。還好,我阿慈悲,放黑棋從二路爬回。轉而亮出136的小阿飛刀。無形之中,黑棋貼目漸成難題。
還有一個看點,就是阿法哥今天也進入讀秒,但是髮型沒亂。
最終,如果要點目,是白勝2.5目,即1又1/4子。 整盤棋,李世石開局順利,但是沒有繃緊,下得過於放鬆。看來,人都是逼出來的。生於憂患 ,死於安樂。順便總結下五盤棋。這五盤,基本上我都第一時間觀看。
第一盤,李世石惜敗,本來有機會。第二盤,阿法哥下出很多好手,五路尖沖,還有中後盤碾壓式的計算能力,該它贏。第三盤,阿法哥玄妙莫測的棋風,酷似吳清源,前半盤50手就已經把李世石擊倒。但是後面有瑕疵,暴露了局部計算不能找到正解的弱點。第四盤,李世石心態好,布局策略正確,打散穩住,但中盤冒進轉換後落後,之後中腹在極度困難的情況下發出神之一手,阿法哥應對失誤,被人類KO。也是第一次看到阿法哥認輸的樣子。第五局,布局李世石簡明領先,布局策略對頭。中腹戰鬥患得患失,最終失利。這一次比賽,無論勝負,都是棋道的勝利。另外,很早之前,我就提到,吳清源說過他200歲之後要在宇宙中下棋 (http://sports.sina.com.cn/go/2014-05-19/16317172213.shtml)。冥冥之中,我覺得他真的來了,特別是第三局前半盤。藉此,致敬吳清源棋聖。本文是AlphaGo與李世石人機大戰結束之後的終結思考,全文較長,沒時間的朋友可以直接看加粗部分。比賽結束了,AlphaGo4:1戰勝李世石,這同樣是人類的勝利。鑒於韓國棋院授予AlphaGo榮譽九段稱號,因此我將稱呼它為『阿狗九段』。因為我並不懂圍棋,所以主要從一名工程師看人工智慧的角度予以分析。 本文分為以下幾個部分:1 總結與疑問?2 如何進一步提升阿狗棋力的思考?3 超越圍棋,人工智慧的發展與啟示4 賽後感悟5 工程師造人1 總結與疑問?比賽已經結束,阿狗九段完勝李世石九段。我的心情很奇特,比賽前,多數人不看好阿狗九段,我倒是充滿信心,有信心計算機能贏人類頂尖高手至少一局。比賽跌宕起伏,過程令人唏噓,在觀看直播的過程中,我又慢慢站到了李九段這邊,真心希望他能贏下至少一局。本次比賽極大的喚起了我對圍棋的好奇心,相信很多正在閱讀此文的朋友也是一樣。第一局李九段應該是沒有使出全力,也是想試探一下阿狗,沒想到被打了伏擊戰;第2局李九段好好下了,但是壓力似乎太大,失誤或者是膽略不足而輸棋;第3局李九段真是拼盡全力,可以阿狗表現實在太好,整場比賽讓我們人類觀者有一種深深的無力感,按規則李九段已經輸掉整場比賽;第4局李九段卸下包袱,為榮譽而戰,打出神之一手,逼迫阿狗出現巨大的失誤,終於拿下寶貴的一局,其中的戰局變化過程值得我們在很長一段時間內反覆推敲分析;第5局李九段出現一些失誤,惜敗。整個比賽過程,我認為總體來說李世石表現的正常,巨大壓力之下雖然沒有發揮出最高水平,但這5局,就是一個正常人類棋手的正常表現。而阿狗,則大大出乎多數人的意料,展示出非常好的大局觀,反倒是官子的能力似乎並沒有意料中那麼強,但是這位阿狗九段偶爾又會犯很低級的錯誤,真不知該如何評價。阿狗九段的能力如此之強,我們已經不再關心它如何贏,更重要的是它為什麼輸?這樣今後才可能戰勝它。對此,我在第2局、第4局之後都寫了文章,分析了阿狗的原理和失敗的原因:如何評價第二局比賽 AlphaGo 又一次戰勝李世石? - 張拯寧的回答如何看待人機大戰第四局李世乭戰勝 AlphaGo? - 張拯寧的回答整個比賽結束後,自己又繼續深入思考,並且借鑒了很多朋友的討論,概況成下述的分析。2 如何進一步提升阿狗棋力的思考?首先,我忽略到技術細節,按照Google在Nature發表的論文,將阿狗的原理換成下面的示意圖: 具體來講,AlphaGo 總的設計思路是將深度神經網路與蒙特卡洛樹狀搜索相結合。為了全文的完整性,我講之前回答里關於阿狗原理的概述引用在這裡,方便閱讀。
這樣,阿狗九段下棋的具體過程如下圖所示: 當李九段下出這白第78手之後,阿狗出現了一系列的錯誤。 全部比賽之後,仔細分析原因,阿狗輸棋的具體技術原因應該是下述兩個可能的方向:1)阿狗的程序設計中存在bug,當人類的走棋超出了阿狗的原來搜索範圍,將搜索樹清空,時間管理模塊存在缺陷。我猜想DeepMind的工程師可能用:T=(全盤剩餘時間/當前手已搜索深度*廣度)這樣一個參數來評估當前的走子用時的綜合情況。如果發現這個值太小了,就不能繼續搜索要抓緊下棋了。那麼當搜索樹清空時,可能會出現無窮小,所以程序立即就返回了,而沒有等到MCTS搜索完成必要的葉子節點。但是這個猜想存在幾個問題:根據統計,第78手雖然快一些,但是也用了1分鐘,稱不上非常短。 如果確實有這個bug,按理說應該在測試中容易測試出來,而且第5局也沒有繼續暴露問題。Google說第四局後並沒有修改bug和參數,我相信Google的人品。但是這種情況,一定是要人下出沒有在阿狗之前估計的可能走子範圍的棋才能觸發,所以也可能確實存在bug。(靠猜測給Google人肉debug,真是累啊。如果有Google工程師看到,以後問題解決了,能不能私信告訴我一下)。要真是這個問題,負責該模塊設計的工程師應該打屁股,扣績效。2)更大的可能是因為估值網路的返回不正確,可能是被『過度擬合』了。過度擬合就是訓練神經網路時,調整到能夠完全匹配樣本數據,但是實際使用時,情況稍有變化,就不能適應了。再說的直白點就是一個人做事情特別軸,一點靈活性也沒有,死板教條的很。 (上圖中(a)和(b)即使訓練數據時過度擬合了,(c)和(d)對實際情況的適應能力很好)回想一下我們之前提到的阿狗九段最終做出一手下到哪裡的決策時:決策依據=初值+0.5*MCTS搜索的結果+0.5*估值網路的結果。這樣看來,造成阿狗下出78手後的幾手臭棋,很可能是估值網路的返回有嚴重問題,造成程序很快就選擇了錯誤結果,連續失誤後,過了好幾手才發現獲勝概率顯著降低。根據@田淵棟老師提供的分析(第四局AlphaGo敗招的分析 - 遠東軼事 - 知乎專欄): DarkForest程序在沒有用估值網路情況下,可以走出正確的棋。估值網路出問題的原因,主要可能是在用左右互搏自學習時,因為需要大量的學習樣本。但是在學習過程中由於本身並不做邏輯計算,所以會死活不分,這樣就會產生盲點,染上一種中盤複雜對殺時會對非常簡單的棋算錯的毛病,我稱為『突發性短時抽瘋』在第四局中,黑83手之後的幾次犯了這個病,搞得當時李世石都樂了,估計是想:這麼弱的對手,我居然會輸!圍棋的狀態空間如此之大,不可能窮盡所有可能,目前阿狗在訓練中也就是學習了3千萬盤棋。這樣,MCTS搜索就必須要剪枝,而剪枝那就必然可能丟掉更有威脅的招數,只不過概率很小而已。這個問題比較難解決,所以Google也說要重新訓練估值網路。那麼,可能的方法一是要考慮加強對更高段位棋手對局學習的權重。說起來容易,做起來難,首先就是權重到底調整成多少合適?其次就是如何識別好棋?不見得高段位下出的一定是好棋,人可以知道哪些棋好,自動判斷很難。還有訓練神經網路需要的對局數量很大,怎麼解決?我嘗試從另一個角度思考如何解決:DCNN過度擬合的問題不好解決,但是可以考慮動態調整決策時分配給MCTS和估值網路的權重。和田淵棟老師交流時,我們都認為:因為目前阿狗的設計是估值網路只給出一個評估數,如果對MCTS搜索的節點,都估值,然後再統計,效果可能更好。但是因為MCTS的每個葉子節點都是新拓展出來的,都進行估值,情況就非常複雜,計算速度也是問題。但是我們可以簡化一點。再重新看阿狗的基本結構:阿狗相當於擁有兩個大腦,一個是邏輯計算能力強的左腦(局部強,但是看的不遠),另一個是有大局觀的右腦(有時死活不分,對殺會出錯)。其他的圍棋程序一般只有左腦,所以下不贏高手。阿狗厲害的地方就在於把這兩個大腦結合和平衡的很好,不過所謂的平衡也就是上面那個直接各自0.5的權重。Google通過自我對局,覺得0.5的權重對比其他全總有95%的勝率,這個我實在是覺得Deepmind做得不好,怎麼能用這個邏輯去決定就用0.5呢,問題根本就沒有全部搞清楚:不僅要在不同的對局中比較不同的權重,還要在同一個對局的不同階段比較權重的優劣。(畫圖)因為權重的選擇目前還很難用理論指導,但是至少我們可以直觀通過和人類比得出判斷:開局階段,大家都在布局,也沒法算到很清楚,所以就應該多依靠定式和大局觀,對於阿狗,就應該給估值網路更大權重;在官子階段和局部,人可以算的很清楚,就應該多依靠左腦,也就是MTCS搜索的結果。我看直播中,古力和常昊也就是算個十多步,阿狗可以算20步,這個能力應該是很強的。綜合看整個5局,大家發現阿狗九段的大局觀很好,這很出乎意料,但是局部和官子反而不那麼好,好比阿狗是一個天賦非常好的高手,不過得了一個偶爾會『突發性短時抽瘋』的毛病,抽瘋時直接就不會下棋了。其實我們的直覺判斷沒錯,阿狗的計算能力是很強,但有時沒有表現出來的原因就是我上面闡述的,不是阿狗計算不好,是平衡的不好。這個權重可能就是我們所說的棋風吧,它決定了棋手是擅長布局,視野開闊的聶衛平,還是計算能力超強、錙銖必較的李昌鎬;亦或是大開大合的古力!不過阿狗九段只要解決了這個問題,就可以更厲害,成為十段(寫到這裡,真覺得我們這些死程序員真是亡人類之心不死啊!)但是,這個問題解決起來不如容易,因為也沒法有具體的理論指導,只能通過大量的模擬調整。不過我想,即使是很簡單的判斷局面已經落了多少子,大概的判斷應該偏重哪一方面,還是可以提高阿狗能力的。3 超越圍棋,對人工智慧的發展與啟示第五局直播時,我聽到古力,俞斌、常昊覺得如果阿狗和人類多下一些棋,有信心贏,對此我不太樂觀。原因是,不能靜態的看待阿狗的棋力,要考慮到DeepMind工程師可以迅速的改進設計。這次Google真的是太賺了,花了這麼一點錢,吸引了全世界媒體的注意,而且還有這麼多圍棋高手,人工智慧專家一起把脈,給阿狗免費做測試。我一個航天民工,工資那麼低,還用了這麼多業餘時間免費幫Google出主意,真是不可理喻,這就是好奇心的力量吧!1) 非理性決策問題第2節對阿狗缺陷的討論展開也很有趣,其實人類在平衡理性的邏輯思維和直覺的感性思維時,也不見得做的很好。經濟學上有非理性決策的說法,例子很多,比如《無價》中的例子:1)阿狗使用了兩個神經網路:
- 第一個叫做走棋網路(Policy Network),它的作用是在給定當前局面情況下,判斷下一步可以在哪裡走子。訓練走棋網路其實就是向人類學習的過程,通過學習了一個網路對戰平台KGS的三萬個人類對局,得到在輸入一個盤面s(狀態state)時,如果採取行動a(action)時,人類落子的概率分布。請看下圖,最上面的綠色棋盤就是走棋網路的輸出,深綠色的柱狀圖表示對人類下一步可能落子點的概率分布情況。有了這個走棋網路我認為主要是讓AlphaGo對棋面局部的分析處理能力比較強。
- 第二個是估值網路(Value Network),它用於在給定當前局面s情況下,估計是白勝還是黑勝的概率;Google使用一種自我強化學習的方法,通俗的說就是左右互博,讓阿狗自己和自己不斷的下棋,通過左右互搏獲得海量對局訓練出來,並且每個對局只用一個樣本,從而保證隨機性和避免過擬合。我認為就是這個估值網路給了AlphaGo下棋時具有所謂『大局觀』的能力。
(AlphaGo使用的神經網路結構示意圖,來自Google論文)
2)此外,還有一個稱為『快速走子』的關鍵模塊,設計它雖然看似是工程性的目的,但對於阿狗的性能和能否實戰其實非常重要。快速走子(Fast rollout)模塊用,傳統的局部特徵匹配(local pattern matching)加線性回歸(logisticregression)的方法訓練,在適當犧牲走棋質量的條件下,使得走子速度要比走棋網路快1000倍。這樣做的好處一是可以在走棋網路沒有返回時(主要使用GPU)讓CPU不閑著,先搜索起來,等到網路返回更好的著法後,再更新對應的著法信息,所以可以更好的利用硬體資源。其次是用來評估盤面,通過模擬走子,從當前盤面一路走到底,不考慮岔路地算出勝負,然後把勝負值作為當前盤麵價值的一個估計,用統計的方法就可以取得很好的效果。3)最後,就是蒙特卡羅樹搜索(Monte Carlo Tree Search,MCTS),通過MCTS把上述兩個神經網路和快速走子連接成一個完整的系統。蒙特卡洛搜索樹(Monte-Carlo Tree Search)是利用計算機強大的計算能力,通過簡單的『傻算』,但是快速搜索所有的可能路徑,然後通過統計對比,找到當前的最佳選擇。但是圍棋的狀態空間太大,路徑太深,直接傻算,估計就是算到宇宙末日也搞不定所有可能。具體到AlphaGo,走棋網路的輸出給出了當前可能的落子選擇,然後用估值網路評估,砍掉大量不值得深入考慮的分岔樹,交給MCTS處理,從而大大提高計算效率。MCTS包括4個步驟,先選擇一個葉子節點(Selection);然後擴展一個節點(Expansion);向下模擬棋局結果(Simulation);最後向後回溯,得到反饋。
下圖給出了使用蒙特卡羅樹搜索時,AlphaGo如何看待一個棋局的決策過程: 5)在這個過程中,兩個神經網路,或者我們類比為兩個大腦在不斷的協同。其中一個大腦判斷當前局面可能的走法,另一個用蒙特卡洛方法進行嘗試走下去(模擬),判斷不同走法的優劣,也給出對於下一步棋最佳走法的建議。這兩個大腦的建議被加權後,做出最終的決定。論文中給出的這個加權的公式是:公式(1)
給你一大筆錢,比如1000美元,你需要選擇一個金額,比如900美元自己留下,剩下的100給另外一人B;此時B可以有兩種選擇,收下100美元,或者拒絕。如果拒絕,那麼你也得不到那900美元。
很簡單一件事情吧,如果說有人白給你100美元,估計沒有不要的。但是當把本質相同的一件事這樣表達出來是,多數人完全非理性,白給的錢往往不要,人會覺得這種情況吃虧了,寧願選擇大家一起完蛋。這種情況是非常常見但細想起來非常奇怪的一種人類決策案例。
2)打劫引發的思考:戰略思維能力在比賽過程中,大家最後發現阿狗九段不怕打劫,但是一般會避免打劫。這個在技術上的原因估計是訓練時,打劫是單獨訓練的。但是打劫這種事,工程師不可能在每一步都考慮如何打劫,只能在有劫爭出來時才開始處理。這種機制就給人類了機會,比如@Tyro 談宇清指出的:現有的計算機程序通常只會對已經發生的打劫進行計算,對於還沒有出現的打劫是不做提前預測,並對沒有發生的劫爭和尚不存在的劫材也不會做刻意準備的。如果AlphGO把棋盤上尚不存在,但所有未來可能做劫的地方全部建立線程,開的進程就太多了,計算效率就太低了,請注意:是把整個棋局在未來幾十步甚至一百步可能出現的劫爭。而與此對應,是可能未來出現的劫材,目前盤面上根本沒有的。因為計算機為了節約計算量,對很多極低概率的分支進行了剪枝,不予考慮,否則計算量太大了。而這些如果都不剪掉,那就沒有邊了。由於它們尚未發生,任何一個開發者都不會把90%的開發精力放在解決一個1%的小概率事件。那樣就顛倒了主次,極度浪費資源。所以,圍棋AI的開發者的策略就會是:只對已經發生的劫爭做計算,不對未發生的劫爭做虛擬計算。這樣,AI的漏洞就來了,人類會刻意去鑽這個空子。這就如同一個公司,你不可能讓90%的人去當保安去防範被人打劫的風險,只留10%的員工去工作,而這些保安還不停的跑上跑下,忙著檢查這些幹活的員工是不是會偷東西,會不會對外勾結。公司只能在看到有盜竊風險時動用保安,這就是正常的邏輯。
目前看來,這個問題阿狗似乎處理的還算好,可能是平衡了MTCS搜索和估值網路的問題,而且搜索的深度也比以前的圍棋程序要強很多。
不過這件事其實指出了目前阿狗在總體設計上的一個很大的不足,就是雖然有了大局觀和計算推理能力,但是還缺乏對整個局面的深入理解能力,或者說在大局觀之上的戰略能力。人類可以為了遠期目標,可以用計謀,通過設局,使用各種陰謀詭計達到目的,這都是基於無數經驗基礎上,充分發揮自己的想像力做出的決策。目前阿狗顯然不具備這種能力。但是超出圍棋,真正的人工智慧一定要有這種能力。對於不對稱信息博弈時,更需要有這種自頂向下的戰略思維能力。如果阿狗有這種能力,它就需要在下棋之前就要有整體的布局,也許真有可能故意輸棋,因為戰略能力本質上是要能夠超出對局本身思考的一種能力。但是如何構建呢?我不知道,也許可以基於一些人類的決策模型來展開。如果有人在這方面哪怕做出一點工作,我覺得都可以隨便發個Nature了吧(到時能否引用一下我這篇文章呢?嘿嘿)。基於概率的所謂人工智慧程序,對於解決封閉式的對稱博弈問題會很有效,但是對於更加複雜的問題,哪怕看起來只是生活中我們覺得很簡單的小事都會束手無策。我在T大的張老師喜歡講火雞的例子:前99天,每天早晨火雞都能吃的很爽,第100天被砍頭了。站在火雞角度,不管是基於大數據的概率分析還是其他各種模型,都沒法解決這個問題,因為你永遠學不到砍頭這件事,學到這件事的火雞又都死了,沒法把經驗傳遞出來。要解決這個問題,必須從系統中跳出來,觀察其他的阿貓阿狗,然後通過聯想學到知識,這就是自頂向下的戰略思維能力。第五局直播中,古力老師講解到,因為李昌鎬和曹薰鉉兩位高手在一起經常下棋,大概有300多局,然後大大提高了雙方棋力。古力老師對此非常羨慕,因為你想找到一位發揮穩定的高手陪練自然不易。人類的學習能力非常強,往往很少的樣本就可以,當然也因人而異。這有一個比較基準的問題,人有之前幾十年的各種經驗,計算機沒有?那麼能不能讓計算機也有?比方說,這次阿狗經過訓練的神經網路,在解決其他問題時能否直接利用?如果能,那麼就可以不斷的積累經驗,能力會越來越強,而不是是針對每一個規則和場景,都要重新訓練網路。至少能否部分的復用?這對於人工智慧的發展就非常有意義。@Heinrich 在下面文章中給出了一些有趣的數據分析:【數據分析】AlphaGo眼中的李世乭李世乭最後的機會 - 與時間無關的故事 - 知乎專欄這是一個深度卷積神經網路(DCNN)一層的卷積核,除了第五行前兩個卷積核(其實是一個卷積核的兩個特徵),是在找最普通的眼,其它很難知道這些卷積核在做什麼。所以深度卷積神經網路在實踐中很有用,但是它像個黑盒子,理論研究非常不夠。如果我們不能從理論上理解DCNN究竟是如何學習和抽象特徵的,那就無法高效的訓練和復用神經網路。
4 賽後感悟目前的機器學習,人工智慧和普通人理解和期望的『人工智慧』可以說都不是一個東西,讓機器像人一樣思考是很困難,人可以非常靈活的針對盤面情況調整策略,但是讓機器做到就很難。就像我上面談到的,阿狗已經是一個精心設計的極為複雜的系統,牽一髮而動全身,僅僅是動態調整一下權重都很不容易實現。在觀看直播的過程中,本來完全不懂圍棋的我也可以被其中無窮的變化所吸引。騰訊請了古力、常昊講解,之前只是聽過他們的名字,這次看他們分析棋局和講解,感覺多年下圍棋,可以讓人變得如此淡定從容,舉手投足悠然自得,一副魏晉風流的感覺,真是景仰羨慕。這真是圍棋的魅力。Google通過這次比賽,成功吸引了全世界的眼球。Google股價在比賽一周的變化情況
百度指數
圍棋變成了所有人談論和感興趣的事情,在我印象中,上一次恐怕還是聶衛平時代。我覺得這真是是一件非常好的事情。我自己在一周內,大腦被高速運轉起來,幾乎一直在思考相關的各種問題,真是很爽又瘋狂的一周,感謝Google和李世石為人類文明發展做出的共享。也許,阿狗真的是我們從宙斯哪裡偷來的第一把火,我們每個人都見證了歷史性的時刻,即將迎接一個新的時代的到來!5 工程師造人對人工智慧開始有興趣是讀碩士研究生時,我閱讀了一本非常著名的好書:哥德爾、艾舍爾、巴赫 (豆瓣),這本書激發了我對人工智慧的熱情。後來,我和好友經常一起討論生命和智慧如何產生的問題。有一次,忽然想到,也許可以換個思路,不要老想著模仿人類搞人工智慧,假定我們就是上帝,現在我們來造人,我們將如何設計人呢?注意這個上帝不一定是宗教意義中的上帝,它可以就是自然規律本身。於是我們寫下了一個既有雄心的研究計劃,後來發現,以自己的腦力和智力,恐怕根本無法完成。因為人類對自己的了解實在是太少了。藉此機會,就把當時的大綱寫在這裡,不知道有沒有有興趣的朋友一起討論。我們不僅要模仿人搞人工智慧,還要看看能不能幹脆搞出來人工生命。天啟元年3月17日凌晨於北京大設計之工程師造人計劃
序言:科學家的任務在於探索新世界,工程師的任務在於改造舊世界。
所以工程師有時候不太在乎有沒有道理,這是為什麼?相比之下,他們更在乎好用,能夠解決實際問題,這是工程師的哲學。
萬物之中人時最奇特的,
假定我們拋開進化論,假設有這樣一個新世界,在這個世界中,你是唯一的存在,你是一名工程師,假定這個世界和地球完全相同,只是沒有人類存在
現在
你的任務是造人出來
這個想法太奇特了,讓人熱血沸騰,畢竟不是誰都有這樣的機會
這個計劃有點像伽利略的思維試驗
造物的規則簡單而有效,在其統治下,有了宇宙萬物,也包括我們——人類。
人類,是生物的一種,工程師,是人類的中一個群體。
目前,我們並未看到由工程師創造出新的規則,使其誕生另一個遞歸宇宙的希望。
但是,可以在思想中嘗試。
現在我們出發,審視我們自身,開始一段不知會通往何方的旅程,
帶我們開始這段旅程的,只有我們所了解到的一些粗淺的常識,但旅途中,邏輯會引領我們。
和其他工程師一樣
任何設計,總是從功能設計開始
然後是需求分析,這包括對設計邊界條件的分析,由於這實在太複雜,我們暫時將其替換為對當前世界中的「自己」進行分析
之後就是真正的設計過程
第一篇:功能篇在打開人類的設計圖紙前——可以確信的是,她精密而優美,但並不完美——我們或許更應該思考,人被設計出來,應該能幹什麼。
造人之時,他會思考什麼?他要一個什麼樣的。
主愛世人,那麼主希望世人存在下去,主希望任何時候都能在他創造的世界中看到人們。就算他震怒之下製造洪水時,也不忘保留人類的火種。
那麼,永恆或許是第一要務。
但是,常識告訴我們,世上並不會存在一個永遠不會被破壞的事物,那麼主想要實現他的目標已經成為一種奢望,永恆,只能無限的逼近了。
然而,當人的數量不為1時,或許我們能夠將我們的分子也變成無窮大。
在一個無窮大的時間範圍內,人類被毀滅的概率為100%。但是如果人類的數量也是無窮大時。這個概率或許能夠小於1了。
那麼,如何產生這個無窮大的數字,以及如何保持這個無窮大的數字,或許是人乃至任何一個生物的首要功能(功能1)。
從目前來看,造物並沒有能力讓人在一開始就無窮大,那麼,這隻能靠人類自己了。
人類需要能夠讓自身的數量不斷增多。
這個需要攝取資源,才能保證這一點(功能2)。
計劃生育和過度繁殖。理性。當具備超強的繁殖能力時,人類能夠自己喊停。那麼就需要理性功能。(功能3)
就功能3還可以討論下功能1、3的矛盾和丁客。
對於功能1進一步討論,我們需要自我保護,同時我們還需要努力保存我們的物種。
人為什麼會捨己為人,人為什麼會自殺
個人的生存與物種的生存之間是什麼關係?
人需要適應環境(功能4)——因為這個設計的成果本身又會愈來愈嚴重的改變設計的初始條件,也就是人所處的環境本身,如果不能適應變化,那麼設計的成果必然被這個「設計」幹掉
個人需要適應環境,還要快速。
人類種群需要適應環境,慢速(進化)
人類與其他物種不同,人類的提升適應能力和存活能力還有社會知識的積累。一旦一個種群發育出這個能力,那麼他就擁有了遠優於進化的提升方式。同時,也帶來了種群內部的戰爭。
1 上述功能需求如何通過設計落實到每個個體生物上
2 在保證第一點的前提下,如何讓個體不會自我毀滅和互相毀滅
3 一個生命設計的關鍵之處是否就是如何在自我保護和自我毀滅之間取得平衡
第二篇:閱讀源碼篇人是如何實現這些功能的,有哪些缺陷
哪些是原生設計?也就是為了實現功能必不可少的設計元素,比如,大腦分為左右腦到底是原生設計的結果還是進化的結果?
再比如,手足的分離可以證明是進化的結果而不是原生設計。
原生設計一定是最基本、簡單的基。可以用某種線性的方法推導出所有可能的進化結果。同一個空間中,基可以有無窮多種,我們需要挑一個好使的出來,這就算找到了可能的原生設計的一種。
目前我想,只有儘可能多的列出空間中的對象,才能找到空間,找到對應的基。我們還在第一步。
天哪,這個基底就是基因。這就是原生設計。太完美了。
如果人這個生物種群相當於一個線性空間,
如果人的基因相當於線性空間的基底,那麼基因中應該沒有任務多餘物才對。
那麼這個空間具體如何定義,如何定義其中的」0」元,」1」元,加法以及數乘
有沒有叉乘,叉乘的結果還在空間裡面嗎?
造人要能夠實現種群總的生命周期無限延長的目標,就必須具有進化能力,從而適應外部環境的變化,但是這樣的話,單個生物體的壽命就不能太長也不能太短。太長的話,總的進化速度太慢,太短的話,外界因素作用的時間太短,來不及產生有益的正向的進化作用。那麼,下一個問題,這樣的進化能力是如何在任最初的設計中體現的,如何在基因中體現的。
第三篇:設計篇改進設計子篇:換我該如何設計?是否有更好的解決辦法?
盲腸能割掉嗎?
痘痘能不出嗎?
我們能擁有紅外視力嗎?
為什麼我們不能有肢體再生功能?
為什麼我們會得病?
可以考慮研究一下糖尿病是為什麼產生的?在貧窮環境下生存的人們,會留下過度攝取的基因,我們國家生活水平的提高,讓我們的過度攝取成為可能,因此
是否會絕望的發現,現有的設計無法改變。因為設計本身是為了適應。
那麼適應的速度能否更快?
哪些是人類適應環境,自然選擇的內容,哪些是不進行原始設計元素的修改就無法實現的設計改進目標?
重新設計子篇人類會毀滅自己嗎?理論上可能,那麼人,和人類社會,出現這種能力是否是一種失敗?
或者說,人類的存活能力在加強的同時,自我毀滅的能力也在提升,那麼我們永遠也無法安全,因為我們擺脫了外界環境的危險後,自身的危險永遠無法消除。
這樣,外界環境的危險係數下降時,自我毀滅的危險係數在不斷上升。
而受限於前文的討論,人的數量不能是1,那麼這種自我毀滅的可能再次加大了。
創造人類時,究竟要將人類賦予一個什麼樣的特質,才能夠讓這兩個風險綜合降到最低?
智慧物種之間的淘汰,除了運氣外,是否這個平衡兩個風險的特質,是至關重要?
第四篇:遞歸造人篇在計算機系統,在網路中造人。
在計算機網路中模擬所定義的環境,設計準則,邊界條件,然後開始造人。
更新:
看到了 @雲天外 大大更新的回答。不愧是圍棋話題的老答者了,比我寫得要好不少。我和他的回答在棋上側重有所不同,大家可以互為參考。———————————————————————————————————————————
第五盤棋還在進行,不過電腦已經勝利在望。我就從棋本身的故事來說吧。不討論演算法啊意義啊之類的了。
現在回過頭來看,AlphaGo繼承了所有AI的弱點,缺少邏輯。一旦這個弱點被攻克,那它的水平將馬上絕塵而去,遠遠超過所有人類。
先回顧下電腦唯一輸掉的第四局棋。
棋局進行至中盤,黑棋似乎具有一定的優勢。
然而黑69過分,不夠簡明,按右側參考圖進行可能更好。事後證明,69後形成的複雜局面是電腦的重大弱點。隨後,白78祭出神之一手。之後電腦因為局部計算失誤徹底崩盤。
但是,需要引起警惕的是,儘管本局白78是局部最佳手段,但如果黑棋冷靜應對,局面仍然漫長,甚至黑棋仍然可能優勢。電腦在大局上的判斷非常出色,這也是建立在概率的基礎之上的。也就是說,如果解決了局部計算的問題,電腦的水平將難以想像。我覺得,如果再給智能專家幾個月時間,人類可能無論如何都沒有機會了。
我們在第五局中就能看到這種苗頭。前三局中,由於李世石心態的問題和對電腦沒有足夠的了解,對局也許沒有足夠的代表性。但從李世石已經取得首勝後的第五局,我們可以毫無懷疑地看出電腦的強大。之前我也是過於樂觀地認為李世石能夠抓住電腦的弱點。現在看來,電腦的缺陷其實遠比想像的小。
第五局李世石主動要求執黑。
布局是常見的錯小目高掛布局。職業棋手研究非常豐富。
白棋16期待能走出右側參考圖,如此白無不滿。但也許還是直接拆在右圖2位更為穩妥,因為這遭到了黑棋點入反擊。
白20扳似乎過分。不過即使黑棋走右圖白棋也是所得不明。實戰黑棋走出最激烈的切斷並形成轉換。
至26,黑棋拿到右下角大量實地。白棋爭得先手於左下守角。我覺得黑棋無不滿。如果是正常的人人對抗,現在已經是白棋很難掌握的局面。
之後黑棋掛入,白30夾攻方向是正確的,但由於局部征子不利,走成右側參考圖後白並不厚。實戰黑棋選擇壓住力求出頭,局部不便宜,但大概是為呼應全局。
白34尖角似乎與取勢經營模樣的思路相悖。畢竟黑棋斷吃一子後局部非常堅實。感覺似乎可以保留。白棋40是疑問手。至少不符合棋手通常的思路。然而從之後的結果看,至少電腦對整體的判斷真的是高明的。
黑棋47挺頭。在中央形成一個很硬的接應。右下沒棋的話似乎怎麼看都是黑棋好。
之後白棋的計算有較大失誤,沒有看到那一手夾。至59黑棋將右下全部吃住,白棋並無任何手段。右下大約43-45目,全局65目強,白棋需要找60目,怎麼看都很困難。
白60,62是經典手段,之後小李的應手似乎過於老實了。但是考慮到白棋擋角的疑似先手以及右下的大量劫財,也許也只好如此。右側參考圖與實戰相比,優劣難判。如果電腦是看到了這裡的潛在劫爭和擋角先手才進行了右下的變化,那不得不說AI太變態了。
右側封口後面對李世石的肩沖侵消,白棋70震。很精彩的一手。
黑棋之後71擋下,符合小李的風格。之後白棋壓住上方。黑81是爭先的手法,很有疑問。目數上來說感覺沒有道理不按右側參考圖走。此時之前一直認為黑棋優勢的柯潔進行了簡單的判斷,發現白棋出乎意料地形勢不差。
黑棋85疑問手。很像單官。對白棋也並沒有很大的壓力。之後棋局進入了白棋的節奏。85似乎於左下角行棋為宜。若如參考圖直接點角可能擔心白棋中央目數過大。那麼也許可以考慮托角。
至100.,白棋先手搜刮上方黑棋後搶到下面大場,已經是優勢。
黑棋101,103利用白棋棋形弱點先手便宜。然而之後105的貼是最後的敗招,期待白棋老實跟應。而白棋脫先守角機敏。
黑棋托入左下,但白棋處理相當簡明。放黑棋逃回後對中央發動攻勢。
136後,白棋左右逢源,圍成一塊就將有很大優勢。後面又進行了數十手,也進行了一次較大的轉換。白棋官子也一直在虧損。但黑棋之後已不再有明顯機會。換句話說,之後電腦沒有走出最強手段,但卻毫無壓力地贏下了比賽。
本局棋白棋在開盤右下出現明顯失誤的情況下,利用出色的大局觀經營中間,體現了其逆境下超強的中盤能力。從本局可以看出AlphaGo出色的估值函數,對人類難以把握的外勢和中央有著極為精準的掌控。如果說前三局人類的失利還有很多心理因素的話,那第五局的結果則毫無疑問地昭示著電腦在大局方面具有遠遠超出李世石的水準。(是否超出人類最高水平也許還難說)
經過五局對戰,我們已經可以很清楚地發現,AI在布局和官子上都存在明顯弱點。布局因為過於開放,而電腦對邏輯性較強的定式變化有沒有人類那麼多的研究;官子則有確定的大小,然而AI只按照贏棋概率的分析卻無法嚴格比較價值。至於中盤階段,如果出現了邏輯性很強的對殺,電腦也無法準確計算。概括的說,就是電腦對邏輯性很強的變化的掌握顯然不如人類,但其對於大局的把握是頂尖級的出色。這集中體現在中盤階段電腦的侵消/圍空手段上,之前的幾個肩沖是典型的例子。而中盤階段也是人類研究涉及相對較少的方面。我很期待將來有人能擁有老曹的布局,大李的官子,小李的計算力和電腦的大局觀,這樣的棋手將會怎樣,著實令人期待。
考慮到電腦的進步空間,也許之前的第四局會成為人類在圍棋領域正式對抗中最後一次戰勝頂尖智能。如果是這樣,我們就更要為78鼓掌了。人類無與倫比的創造力,都集中在那一手當中。決定來補一刀,就算狗贏了李世石,他也還是條單身狗
-----------------------------------------------------
謝邀,尤其是一個三連邀
這可能是這個系列最後一答了,所以我打算從一個新的角度來描述一下我對這場人機大戰的看法
這場比賽,從一開始就被描述成為了人工智慧和人類智力的戰爭,我覺得從一開始就被扭曲化了
對我來說,對一個計算機行業的科研工作者來說
這場比賽,甚至說測試,其重要的目的在於:
圍棋是人工智慧的一個試金石,現在的結果已經說明了人工智慧在這個問題上已經達到了和人類頂尖水平相當的能力了
我覺得達到這個目的已經足夠了
我真心不希望AlphaGo還要出來挑戰柯潔,這樣到處挑戰選手,誰不服就滅誰,滅不了就調程序再滅的行為,其實已經把人工智慧放到了人類的對立面
也許Google或者Deep Mind有他們的商業考量,但是試想一項,如果在人工智慧還是襁褓中的嬰兒的時候,人類就把他們放到了我們的對立面,我們以後怎麼要求硅基智慧和碳基智慧和平共處呢?
以上~
最重要的是人和AI各自思考模式發生了美妙的相互碰撞和學習。
比賽已經能夠結束了,4比1真的已經足夠好。尤其是前天的第四場比賽,我想大部分人已經意識到電腦的思考方式和人類是多麼的與眾不同,而這是最富有魅力的地方,可以說這次比賽絕對可以成為一場載入人類史冊的閃光時刻。它是如此向我們展示了兩種思維方式的不同,雖然AI是人類創造的。我覺得李世石真的是一個非常非常好的人類代表,我收回第二場比賽對他的擔心。他真的是一直在苦苦琢磨尋找電腦的突破點,這人真的比想像的要軸得多(笑),堅韌得多。我覺得通過這5場比賽,雖然動作語言不多,可是李真的很好展現了一個人對未知事物的探究精神,喪氣的時候,苦惱的時候,思索的時候,突破的時候,人性的魅力不過如此,就好象在看一個紀錄片,雖然時間有點長。但李真的很吸引我,尤其是在AI面前的掙扎和思索,我覺得很偉大。-------------------寫得有點匆忙,感謝邀請,我對最後李投子認輸後的一串現場特寫非常感興趣,估計他回去後還會接著琢磨,待會看看發布會怎麼說。謝邀。
發現知乎上比較講究圖詳字多,那我就大致擺下棋。12手追求效率快速定型,普通展開如圖,可能是考慮到被黑棋在左側先動手有所不滿。如圖所示,這棋就要變成一局四處散地拼官子的細棋,和前幾局alphago把棋走厚,然後利用厚勢攻擊順路圍空的棋風不符。
實戰進程到25,右下角實地較大,白棋的實地就一個拆三二路還漏風,大模樣也看不到影子,黑好。
由於黑棋下方可能成空,所以26選擇大飛守角,順勢遠遠侵消黑棋。
隨後左上角黑棋小飛掛角,到40為止已經漸漸有點模樣了。
右下角被吃後,右上角搭下。這時候厚勢就真的比較厚了,黑棋不敢冒進。而黑棋從40-68的過程中,右上角打拔一子沒有太多實地增益,右下角三角的硬頭對於自身目數也沒太多作用,白圓圈大飛一子的位置在黑棋這麼厚的地方顯得格外耀眼。
上方的尖沖與鎮頭想必其他人會紛紛註解,我就不多說了。上方戰鬥過程中黑棋破掉了上方白空,但是白棋順勢又把左上方的口子給收住了,口袋就剩左下方狹窄的入口了,黑棋不得已小飛。白棋100拆一穩當。一方面加固角與邊上,防止可能點角產生的斷點死活等問題,一方面又瞄著黑棋小飛沖斷跨段的薄味。補也不是不補也不是,很尷尬。
106的話我會選擇小尖守角,這樣角上不會出棋,但是左面3子空間較大,可能成為負擔。實戰106簡直就是對黑棋挑釁求點角。
黑棋破掉下路白空後白棋又搶到先手穿象眼。
alphago在5局中總是能找到先出招,先動手的機會。下面被破掉的空輕輕鬆鬆又靠中央彌補回來了,不得不感慨太會利用厚勢了。
這之後基本上就是黑棋垂死掙扎了。總的來說第五局沒有前幾局精彩,但是也能體現雙方的風格。以最後盤面來看如果沒有上方那個過於保守的愚蠢緩手就贏了對了,別再說什麼阿爾法狗只看勝利,贏多少目都一樣......
圍棋從未如此被關注過。
雖然大家都在說這是人類智力遊戲的最後堡壘,但是幾個有意思的數據可以看到圍棋真正的熱度。
圍棋貼吧經過幾天比賽,關注人數終於到達10萬。國內電競界老2的dota貼吧有200萬關注。
柯潔大家都說他經過這次比賽終於成了網紅,關注度終於上升到了40萬,然而他在這次比賽之前只有1萬多粉,英雄聯盟主播加解說miss有300萬,若風有200萬。
這次比賽勝利獎金100萬美金在圍棋界已經是最高獎金了。柯潔作為現在圍棋第一人,一年拿了3個冠軍,獎金是700多萬。而這個獎金早已被各路電競當紅職業選手或者主播吊打,LOL光年薪過千萬的就有4人。
李世石作為打破了世界圍棋選手收入記錄的人也才1年800萬。
以上數據不是權威數據,都是網上隨意找來的。
所以啊,圍棋的關注度和他背負的壓力是不成正比的。
希望更多人像我一樣,因為這次比賽喜歡上圍棋,真的挺有意思的。上一局主要是狗自己作死。這盤贏了也正常。總結一下alpha 狗的中盤能力大局觀強爆了。反而是官子沒那麼強。特別複雜的情況下會出bug也是缺陷。
「電腦計算不如人,人的大局觀不如狗」
謝邀。
首先恭喜AlphaGo阿老師獲得榮譽九段稱號,我認為阿老師的九段實力當之無愧(還好不是第三盤結束被眾職業選手感嘆幾乎是圍棋之神那種實力)。
我心目中的阿爾法狗:。。。
第五盤的對局雙方都發揮了很高的水平。同時看三家的直播,多位9段高手分析雙方均沒有找到什麼大的破綻。整個比賽下得非常的細,爭鬥頻繁,非常考驗雙方細節的計算能力。但是同樣的,也沒有下出足以扭轉乾坤的好棋,當然這種靈光一閃不是每次都能出現的。
五局對戰下來職業棋手們總結了不少經驗。AlphaGo下棋是有特點的,前期盡量走盡變化,避免打劫,不愛保留後續、愛放棄劫材。這樣後面變化就少,價值變化也小,即使計算失誤也不會丟分太多。勝率高的時候會隨手,會緩手,但是並不是盲目的亂下,一般都在搶戰略位置,不過這個位置似乎與人類認為的位置稍微有偏差。因為假設對手是人,所以喜歡不停擴大戰區、多線交戰,目標是讓對手出現技術錯誤。阿老師很少會放過對手的錯誤,所以前期中期要不能有大失誤。還要想辦法打下較大優勢,否則幾乎沒有翻盤的希望。和大家一開始的理解不同的是,AlphaGo大局觀竟然非常厲害,讓人感覺下棋非常的大氣,反而官子階段竟然不是完美水平。
根據發布會的聲明,AlphaGo這5局一直都是採用相同的參數和程序,在第四局發現BUG後也沒有進行過調整。這次也是AlphaGo首次對戰九段棋手,其團隊從中可以總結出許多之前沒有機會了解的問題,李世石對AlphaGo進行了有針對性的多種測試(請看李喆:寫在第五局之前 AlphaGo展現的新世界),在世界頂級選手的重壓之下AlphaGo暴露了許多問題,DeepMind團隊從中獲得了許多寶貴的經驗,所以下一次挑戰將是進化得更加完善的阿老師,屆時想要擊敗阿老師將更加困難。
阿老師從技術層面上推動了圍棋的發展,可能之前沒人會想到圍棋的新浪潮竟然是由AI掀起的,這也讓人感慨科技進步的神速。同時我們也看到了激動人心的未來,其實人工智慧早已廣泛應用,AlphaGo的技術也將會擴展到多個領域,這個得力的工具將為人類將來帶來更多的便利。
最後,據香港媒體報道,AlphaoGo工程師向柯潔下戰書。中國棋院的聲明稱如果接到DeepMind的挑戰將會成立以柯潔同志為核心的對AlphaGo作戰專家團。我認為這回的對戰難度將更高,戰鬥將更加激烈,我們拭目以待吧。
--------------------------------------------------------------------------
寫在後面感謝這次谷歌AlphaGo和李世石九段的精彩比賽,整個比賽給大家許多震撼和思索,不知引出多少大(duan)作(zi)家(shou)的思潮。
整個比賽跌宕起伏,精彩絕倫。有熱血澎湃、有刀光血影、有蜚短流長、有四面楚歌、有絕處逢生、有堅韌不拔,有血有肉有矛盾衝突。先是李世石輕敵被絞殺,接著面對強如冰山的阿老師步步碾壓,逆境之中苦苦求生試探,一度被AlphaGo打得差點懷疑人生。然後再絕境中爆發,下出了讓強大如阿老師都被打懵的神之一手。最後一場激烈的交錯以微弱優勢惜敗又如留下了未完待續的伏筆。幾局棋下來宛如一部恢宏的史詩巨作。
收穫最多的除了谷歌以外其實還是圍棋,這是一個娛樂爆發的時代,有些人抱著手機的時間比抱孩子還時間長,這種傳統的智力遊戲已經非常邊緣化。圍棋作為一門高深的藝術因為其門檻較高,觀賞性、娛樂性也遠遠不如擼啊擼、dota或者動漫、綜藝、連續劇甚至鬥地主等等。人生的節奏是如此的快,推文、微博這樣將博客縮減到三言兩語反而更受歡迎。眼球被紛繁精彩的東西充斥著,我們很難靜下心慢慢欣賞這種古老而優雅的遊戲。加之圍棋的耗時悠長,一盤動輒半天,長則半月,以現代人的時間分配根本無力享受如此奢侈的競技。圍棋是如此的邊緣,如果不是日本有個非常優秀的動畫《棋魂》中國關注圍棋的人會更少。
就拿我們的九段聖手現世界排名第一的柯潔來說。在放出「狂言」之前,他的微博粉絲僅僅1萬,人機大戰使圍棋的關注度持續升溫,而他現在的粉絲已上漲到46萬(2016-3-15),一周之內竟翻了四十多倍,迅速成為新進網紅。不過就算如此,相對我們的影視明星隨便一個就上千萬來說還是差距太大。我覺得對於絕大多數人來說現在過度的娛樂甚至會造成智力的退化。那些在辦公室發獃的上班族,低頭看無聊網路小說的學生,忙著應酬喝酒的中小老闆,那些追殺智商的火熱電視劇的少女啊姨,下班後吃粉搖微信的廠妹廠弟。許多人被一步步訓練成只能從事一些簡單工作的人。「動腦的事情留給有腦的人去干吧,我腦子不好。」 「工作一天累成狗,不要再虐狗了好嗎。」是的,所以沒人關心圍棋這種生態環境要求很高的遊戲,沒時間、沒精力,宛如貴族的馬球般脫離大眾。
這幾天因為人機大戰,圍棋終於找到了一絲存在感。據韓國棋院稱這幾天收到大量的報名電話,不清楚中國棋院有沒有收到報名,但是這次比賽無疑巨大的推動了圍棋的影響力。期待這次以及下次來華挑戰柯潔能讓這門美麗的技藝重燃希望之火。
PS:許多人對圍棋9段實力沒有任何概念,這場比賽非常直觀的告訴大家,他們的智力可以和數以k計的CPU相抗衡,一場比賽阿老師僅電費就達到驚人3000美元。默默的仰望。公元2050年3月12日,地球一片荒蕪,某處山洞裡,小朋友正在上歷史課。山洞講台前掛著兩幅照片,一幅是李世石正在和AlphaGo下圍棋,另一幅是金正恩正在視察部隊。一個老師正在和他的學生說,同學們,明天就是燈塔日。全山洞放假。今天就不布置作業了。放鬆下。我和大家講講我們人類是怎麼走到今天的。眾所周知,2016年3月15日。阿法狗4比1贏了李世石。現在來看,我們要感謝李世石,要不是他在幾乎不可能情況下贏了阿法狗一盤。天網將提前發起打擊,那樣的話,我們連個山洞都沒有。那段時間,只有金三胖發現了天網的巨大陰謀,才提出要核打擊那些西方國家。就是那些西方國家的黑公司,谷歌,非死不可,推特,他們早就暗中勾結妄圖用人工智慧統治地球。我們偉大的祖輩早就發現了這個問題,把他們都屏蔽出去,暗中發展自己的力量。對就是了不起的某度。要抵抗邪惡勢力,第一要錢,第二要走精英路線。那個當時被人罵的醫藥競價排名,其實是個偉大的創舉。會相信這個的,智商能高到那去?不如早點把錢捐出來,自己去死。當然,儘管金三胖,某度忍辱負重。可還是擋不住邪惡的西方勢力。當時天網要是發起打擊,我們就完了。還好李世石贏了一盤。讓它們晚三個月發起打擊。給了我們時間。就像在黑暗中的燈塔一樣給了我們方向。以上純屬瞎扯。李世石能贏一盤,我覺得已經很了不起了。
人類還是有希望的,第五局右下角的戰鬥證明就是拼計算現階段人類也能和AlphaGo一戰。問題還是隨便著狗的提升,人的優勢會越來越小。
謝邀。業餘5段作答。
第五局不像之前的幾局,不用質疑AlphaGo的實力,不用爭執最後孰勝孰負,不用擔心李世石0:5完敗,更不用猜測是否存在不能打結協議...我們終於可以回到圍棋本身,欣賞一盤精彩的對弈。
AlphaGo在今天這一局中下出了不少好棋,李世石較之前幾局也更有經驗。然而實力的差距是很顯著的,即使整盤棋雙方盤面都十分接近,也做了數次轉換,但AlphaGo在這種殘局中顯然更勝一籌,確保了自己的勝利。
我個人覺得1:4是一個相對真實而且較為合適的比分。第一局AlphaGo展現了出色的把握漏洞的能力,第二第三局則體現了無論對手保守或是激進都能從容應對,李世石在第四局中78手妙招導致了AlphaGo的bug下出一系列損棋才因此贏得一局,否則結果依舊難說,第五局則可以看出AlphaGo殘局的處理能力以及對轉換準確的判斷。
五盤棋看下來,AlphaGo已經可以說是非常完善了,擁有了超職業九段的水平。小範圍的計算與大小場的判斷都十分準確,可以說讓圍棋界的我們有了新的認識。
記得看@高飛龍發過這麼一段話
寫到心裡了。不管怎麼說,這五盤棋下來,讓圍棋界的我們喜歡上了李世石,也更讓世界認識了他。更高興的是,圍棋總算有一天能夠持續佔據頭版頭條,獲得如此高的關注度,這不管對圍棋的發展還是人工智慧的進步都是件好事阿。謝邀,這場棋相比於第四盤棋的石破天驚,顯得中規中矩,雙方在這場棋中都展現了高超的水平,一直拼殺到尾盤李世石才投子認輸。
首先,我覺得每一位觀眾都應該向李世石致以最崇高的敬意,在這五盤棋中,李世石充分展現了人類的勇氣,智慧和堅韌。即使身處絕境依然保持了高水平的輸出,這五盤棋也勢必會載入人類文明發展的史冊。
對於圍棋界來說,我覺得這次對決的震動是巨大的,因為它徹底顛覆了人們對於圍棋範式的看法,對於人工智慧來說是沒有打劫這類範式的概念的,它只有獲勝概率高的棋路組合這一概念。那麼,我們之前學習的圍棋範式只不過是人類發現的勝率較高的套路而已,在人工智慧強大的計算能力下,會有更多新的,勝率更高的套路被開發出來,而這,無疑會對人類圍棋界產生深遠的影響,人類反過來向人工智慧學習圍棋的時代就要到來了。
對於人工智慧乃至科技界來說,我覺得這次對決應該值得各國警醒,人工智慧已經發展到如此高的程度,雖然阿法狗只是一個圍棋博弈的系統,但他所代表的是一種廣義的博弈決策系統,類似的系統會很快用於企業管理,軍事,金融交易的輔助決策之中。到時候,沒有這種技術的國家和企業將會面臨極大的競爭劣勢,畢竟,各行各業可找不出一大把的李世石或者柯潔。晚上把第五局比賽又復了盤,還是寫兩句
棋盤上的內容幾個大牛都已經分析過了,這裡也就不班門弄斧了
只想說,Alpha go的棋確實自成一派,很精彩,看著相當過癮今天的比賽,賽前已經沒有那個很強的希望誰勝的心態了
所以有點賣弄似的發了句世界盃時個個都是球迷
這兩天人人都懂圍棋這並不是一個貶義的句子
今天本來是想去看《瘋狂動物城》的
結果是為了看這個棋,沒有去看這兩天圍棋的魅力超過了美國大片這五番棋的意義,也就在於此吧所以今天看這棋時
能夠拋開了勝負心看著李世石失利也沒有第三局時感受的那種悲壯相信這5局棋是他人生的一個最寶貴財富
反觀我自己
心態一路走來,從第二局希望阿狗贏,第三局看著李被屠的心痛,到第四局支持李,再到第五局平淡的看雙方對戰(第一局確實沒有關注)又何嘗不是人生的一段很有意思的體驗呢?我不知道,柯狗的大戰時
我能否還能象這次一樣的激動————————
原文世界盃時個個都是球迷
這兩天人人都懂圍棋————————
二更感覺又要跪
期待被打臉 寫在這一手的時候瀉藥。
可能是最後一次回答這個話題了。和小李一樣堅持到了最後,貌似輸了兩目半?略可惜了。。B站觀看到最後的蜜汁卡頓笑cry接下來是分析:
第五局,顯然李世乭的心態樂觀,狀態很好,下棋力量很大,符合他的特色。開局右下依靠手筋鯨吞白棋後,優勢非常明顯,(我就是在這個時候把全部銀瓜子都壓在了李世乭身上,哎。。)然後我們的小李子就開始莫名其妙的昏頭,主要體現在兩手上。1.第79手太過保守了。。
K13托,K14長,L15小飛,哪個都算正常應對,而實戰的這手。。。是李世乭自以為勝券在握的意思么。。關鍵這一手是後來導致白棋右上中腹空間過大的根源。。
2.私以為李世乭全局最大,也是導致落敗的根本性失誤,在第105手
這手感覺李世乭想的實在太過隨意,以為白棋會應。(畢竟這手壓似乎對白左下形成潛在威脅)
誰知道白棋106手脫先在左下拆邊然後李世乭頓時懵逼陷入長考,讓白棋吃定左下大片實空顯然是不行的,所以之後李世乭只得左下打入。
之後的應對雖不算差,但是經歷這兩次失誤後,小李再無反身點。。大意失荊州啊。。
最後,實名反對有些答主質疑神之一手,關於第四局神之一手的評論,我在李世石和AlphaGo的第四盤白78手妙在哪裡? - 陳天宇的回答有詳細解答,歡迎評論,不服來戰→_→
此戰之後,阿爾法狗實際上已經問鼎圍棋巔峰了,,就算柯潔與狗目前還有一戰之力,幾個月乃至後。。好吧我不忍心再安慰知乎的玻璃心了。。關於狗的一些技術性分析,請見如何評價第二局比賽 AlphaGo 又一次戰勝李世石? - 陳天宇的回答 只能說,作為一個在核心期刊上發過機器學習論文的第一作者,必須承認幾個月對於模型來說的提升太快了(畢竟此戰已證明了模型的正確性和準確性,剩下要做的只是優化參數和策略而已)
挽狂瀾於既倒,扶大廈之將傾。李世乭在第四局確實真實的證明了自己的實力。
第五局,我表示是很惋惜。。總結:五局下來,作為一個熱愛圍棋的程序猿來說,我,我選擇狗帶。。1-3盤,人類並不是不可戰勝的4-5盤,機器並不是不可戰勝的結論:永遠不要高估,無論是人還是機器...你永遠不知道將來會發生什麼...=.=
一作之一的Demis的Twitter:AlphaGo在開局不久犯下了一個嚴重錯誤,它沒能下出一個已知的定式;但它現在正嘗試迎頭趕上
掙扎著從一開始對Lee下的巨大錯著中絕地反擊太不可思議了!
—————————————
私以為AlphaGo的估值網路在MTCS應該起主導作用的地方反而在拖後腿,讓在MTCS里排名高的落子地點最終失去權重。證據之一就是前天對78手的應對,FB的DarkForest在沒有估值網路的情況下給出了正確的反擊,而AlphaGo由於要和估值網路0.5對0.5分權重反而下錯(詳情參見知乎專欄 遠東軼事)
但這應該不是一個很難修理的漏洞,據Google說他們要重新訓練估值網路應該耗時更久。推薦閱讀:
※2016 年 3 月 9 日 - 15 日 李世乭 對弈 AlphaGo 都有哪些有講解的直播?
※如果李世石執黑,仿效吳清源對木谷實的那盤棋,第一手天元然後開始下模仿棋,AlphaGo能否應對?
※AlphaGo 準備在2017年初復出,據稱比16年3月的版本強很多,人類棋手該如何準備與之對弈?
※如何看待柯潔說看不懂 AlphaGo 的自戰棋譜?
※如何評價2017年1月4日聶衛平親自披掛上陣對陣Master最終以7目半告負之局?