用什麼策略可以戰勝 AlphaGo?
本題已收錄至知乎圓桌 ? 對弈人工智慧,更多關於李世乭對戰人工智慧的解讀歡迎關注討論。
-----AlphaGo熱潮過去了幾天。從一開始的不相信,到震驚,以致一下絕望的情緒相信是大部分人類的心路歷程。好了,冷靜之後,問題來了,怎麼戰勝它?從公開的棋譜和各種訪談論文,大致都提到了AlphaGo的工作方式。我的判斷是:人工智慧不可怕,底下會自問自答一下。也期待各位大家各抒己見。
謝崔明明、朱棋聖邀,抱歉看到得太晚。
說來慚愧,最近時間太緊張,知乎偶爾用手機瞎看看,舉世矚目的AlphaGo對李世石的比賽也只是從FB上每天看看比分和新聞,或者賽後草草看個關鍵局部,看看熱鬧。相信到了今天,專業棋手們已經把AlphaGo和李世石的對局研究透了,小李的棋也許大家尚能議論,AlphaGo的所謂「算路」還是可以讓大家望而卻步了。
除了第四局小李的天外飛仙78可能導致了AlphaGo神經網路的估值出現問題,其它四局的局面,小李都希望渺茫;甚至如果AlphaGo能在第四局的78之後正確應對,那一局的結果依然會撲朔迷離 - 輸棋不能怪小李能力有問題,而實在是因為對弈雙方的計算能力是天差地別。人類只能憑藉大腦一步一步推算,而AlphaGo可以通過神經網路進行全局估值然後用優化過的搜索演算法決定下一步。可以簡言AlphaGo的每一手棋都會選勝率估值較高(幾乎都在50%之上)的點,人類卻只能憑藉「棋感」(經驗)和單薄的計算來應對。李世石如同站在紫禁之巔的葉孤城,仗劍靜待西門吹雪;但最後來赴約的,卻是變形金剛。在下沒有參與過圍棋AI的設計,只是大膽猜一下,在AlphaGo的神經網路自我完善之後,李世石的78恐怕是人類最後的回擊了- 除非人類可以找到圍棋必勝之法,畢竟圍棋在理論上肯定是執黑或執白必勝的遊戲。我不難過,因為我也在學習和研究AI,身邊各國的教授們都有聊到過AlphaGo戰勝小李的新聞- 這次圍棋可是真正走出了中日韓,走向了世界(感謝google的宣傳);我難過,我們在「人類驕傲」的圍棋領域丟掉了陣地。圍棋對棋手來說是榮辱,是喜悲,是謀略,是奮戰,是靈動,是勝負,是藝術;而對AI來說,下棋只是一次次估值和結點展開而已。沒什麼情緒波動,也不在乎任何一個局部,只要隨著比賽進行,保證每一步展開後的勝率估值越來越接近100%,然後等待對手投降或者行棋至結束比賽而已。說完了人類不太可能贏的原因,說點可能的:AlphaGo的演算法目前在計算未來劫材的部分不如人類頂尖棋手(對作者的演算法能力甚至棋力要求也太高了...),也許可以加以利用。換句話說,AlphaGo會「估」和「算」現在,卻不會像人類一樣「謀」未來。滿足以下條件人類也許可以小有機會:1、棋手有頂尖棋力,至少不和小李差太多。2、棋下厚實,不低估AlphaGo在中腹的計算力,目數咬住AlphaGo。3、有機會就做些交換製造幾個潛在的劫材。4、造劫,或誘使AlphaGo判斷自身劫材更多而主動選擇開劫,然後出動潛在的劫材。順帶一提, 猜想AlphaGo的之後的研究投入不會太多了,因為如此出色的AI成果還是應該在更多領域切實幫助到人類,不只是在小小棋盤上取勝而已。
淺薄之見,拋磚引玉。AlphaGo在2016年1月28日爆出大新聞之前,Google(Alphabet)的人透風,要給大家一個驚喜。首先鼓掌,他們做到了!我當時不怎麼在意。再之前,聽過Google用神經網路搞這個,當時認為這就像占卜,不靠譜。畢竟圍棋要精確計算判斷的,計算機再厲害,模糊演算法畢竟都有漏洞。再來,蒙特卡洛綜合症(以前我在KGS大戰Zen給它的某些行為起的名字)也讓機器出昏招的概率大增。
今日看來,我還是站在人類這一邊。
AlphaGo一出來就震驚了人類,職業棋手從棋譜上評價是AlphaGo漏洞極少(也有「不是AI太強,而是我軍無能」的意思)。從棋譜上看,AlphaGo的棋布局中盤官子都沒有明顯錯誤,而且還有第一局一靠的驚艷。官子的測驗少一些,只有一局。其他的都是碾壓樊老師的架勢。這是不是棋神降臨?接下來探討一下AI的弱點和人類取勝策略。
首先,人類棋手的心態很重要。心態好和差,對一個棋手來說,相差高達2-3個子。心態好,表現是對獲勝有自信,不急於求成,尊重對方,按照目前局勢最好的選擇來下。格調高一些的說法,就是「枯窒無物」的境界,或者是「平常心」。這是人類的弱點,情緒起伏,因此必須克制才能戰勝機器。
我們先反思一下職業棋手是怎麼能贏我們業餘棋手的?大致兩種方法。在接受韓國職業九段棋手的一盤指導棋中(讓先倒貼,爆一下棋力,否則大家覺得我胡扯 :D),我悟出一些東西也就是職業棋手贏棋的第一種方法:是以無漏洞本手(相對於業餘棋手)的方式贏棋。他們的每一步和我們的每一步交換,只要中間不斷獲得微弱的優勢,就能積少成多最終取勝。這是比判斷和預測精確度。還有另外的一種方式,是採用複雜變化,進入未知領域,比計算深度的贏棋辦法。這種是李世石成名絕技,也是很多棋館高手業餘高手欺壓百姓的伎倆
從樊職業對AlphaGo的下法,第一局採用第一種策略,因為是遭遇戰,也不知對方底細,最穩健的方式就是先保證我沒什麼大錯,自信最後階段能贏對方,可惜最後受到打擊。從第二盤開始,想試試看對方計算深度,用大雪崩,但是反倒自己下錯了,後面越下越差,棋和心理都崩潰了。
從AI的實現方法探討(參見各大報道和爆料),AI的搜索深度並非高深莫測。這也是我的主要觀點,這也是我們之前一直認為圍棋沒法被AI破解的原因。但是因為一夜震驚,我們都一下把以前的想法都扔掉了。回頭看來,這還是機器的最大弱點。
很多研究,都說機器下得像人,我認為很大原因是人類職業棋手沒有給機器很大壓力,沒有採用那種以死相拼,用計算力死磕的90/10後贏棋方式下,都是很柔和的。這正中機器下懷!蒙特卡洛綜合症和AI的優化,就是保證贏棋概率大,而並非追求神之一手。因此它會漏掉最優解。從公開的資料,機器大部分深度不超過20步,超過了機器就無法判斷了,它只能靠經驗到那裡判斷哪種局面好。而人類頂尖棋手呢?50步100步都能做到。多算勝,少算不勝,千古真理。這就是機器的弱點。
這裡的算,不能是一本道的50步,需要包含很複雜分支判斷的,含複雜打劫轉換。人類職業高手,只要一個局部得手,機器就沒機會了。從理論上看,目前這種地方是AI最大的死穴。
因此,李世石戒絕用很淺的棋,那種只需要靜態形式判斷就八九不離十的棋。因為這些對於計算機很簡單。我舉一個例子,圍棋之眼雖然不是AI,它只是一個打譜軟體,但是自帶朱棋聖簡略判斷演算法,對於大部分平穩的棋,也能自動判斷死活,而且只需要相當少的CPU。
結論李世石只要不心態失衡,以平常心對待,發揮自己計算能力的優點,採取的辦法可以是不斷給機器出難題,5:0可期。3月份,我們再來看看結果。--3月10日更新結果0:2了,李世石心態確實也問題,都是優勢但贏不下來。但是AlphaGo的技術能力遠超過我的想像,它這種烏龜流的戰法確實也是一種流派。土裡土氣,但是就是有錢,你也拿它沒辦法非常贊同Lynn的回答。我從棋該怎麼下的角度給出對付這個alphago的對策。
首先講下法,然後講為什麼,再講如果我們不去下針對AI演算法獲利的棋(對AI行得通對人行不通的棋),哪種類型的棋手可能更適合對付alphago。最後再講兩種猜測。
下法:
1. 布局打散,雙方的棋盡量變成小塊從而增加局面複雜程度。盡量少地讓alphago出現厚棋連片,由於在簡單局面下面對正常的招數時,它的犯錯幾率很小,所以絕對不能讓它連片發揮厚味的效率。在這個基礎上,布局要按照人類已經總結出來的圍棋價值觀,堂堂正正地下棋,而不是去用冷僻布局企圖偷雞摸狗。但所謂局面複雜,並不是指在一個局部像第一盤和第三盤那樣強行大打出手,因為局部戰鬥的計算對於AI而言,雖然沒有強到死活題里那種封閉局部那麼可怕,但由於它的失誤率比人低,所以當我們發現AI局部計算並不是強項時,想想自己在這種情況下雖然經常妙手頻發但是不是失誤更多,或者是妙手本身獲利是建立在別人的應對失誤上。2. 儘早地在變化中選擇有劫爭,而且劫材有利或者可以實現轉換,而且如果對手直接退避劫爭會不利的變化。
原因:
上面這張圖,是李世石對alphago的第四盤。大家都知道第四盤小李贏棋是因為AI低級失誤,否則那盤棋接近20目的劣勢根本無法挽回。李世石在布局階段最大的問題手在於第20手下跳。首先,這步棋在對方是人的時候絕對不是什麼問題手。但是對抗alphago,必須在右上角黑21的位置直接內掛強行把黑棋打散。有幾名仔細研究過AI的職業棋手(比如張一鳴三段)在直播時認為李世石第20手只要敢用扎釘的方式守住左下角,AI必然會在21位內側小飛守角而不是向外側小飛,這是alphago最喜歡的下法。那麼李世石為了發揮自己右下角的厚味以及限制黑棋在右側開拆,白22步子會邁的較大。 為什麼對付人的時候可以這麼下,因為我們點目的時候,黑棋上方足足有5行間距的大拆邊我們是不會點的,所謂」這都不是你的目「。而AI的形勢判斷是會把這些目數直接算上的,因為你22開拆步子太大,那麼這步棋其實不厚,也就使得黑棋上面的邊空相對而言變得厚(因為如果你打入破空,則必然把黑棋撞厚,結果就是白22一子進一步變薄,而徹底影響到白棋右側開拆的目數)。
這時候圍棋TV的技術研究室裡面,崔哲翰九段給出了和張一鳴一樣的判斷,第22手的時候,他認為布局落入了alphago的步調。
第二盤,雙方布局互有失誤。李世石對於AI的問題手——黑13中國流,15尖刺,17托角,以及37肩沖的應對沒有按照人類棋手的價值觀進行反擊。白14沒有選擇29位夾擊黑棋三子而選擇三間高夾反而顯得黑9小飛掛非常輕靈。白16粘住跟黑15的交換其實在目數上互不虧損。面對黑棋托角,白22還是應該選擇23位粘住之後左側定型之後攻擊右側黑棋。白38面對39五路肩沖應當63位爬四路直接讓對手實地虧損。後來AI由於在41肩沖後43動出後的細節手段出現失誤,導致中央幾乎平添一塊孤棋。但是白64的忍讓讓李世石的局面再度變得很膠著。而李世石70,72打拔之後被黑棋73堅實地不住,李世石作為一個攻擊型棋手,全盤再無發力點。大家會看到一個相似的形狀,第二盤和第四盤AI都在試圖將上方的中國流連片走厚,其餘的棋也是盡量走厚,結果是李世石不但實地落後而且沒有發力點來通過攻擊獲取利益。那麼其實這盤棋下到70手的時候不應該是打拔搶目,而是趁中央黑棋未連片之前在73位直接跳出分割黑棋,」敵之要點即我之要點「,以圖進攻獲利。只要被AI如同實戰73一樣,全局下厚,我們可以清楚地看到除非AI低級失誤,不然我們難以抗衡。
因為AI的計算源於價值網路和搜索,所以表現在棋上,它在局面不複雜的時候,控制局面能力超過了人類棋手。但是AI的MCTS有一個硬傷,就是它並不是一種窮舉演算法。那麼當局面錯綜複雜,可選點很多的時候,計算量對於AI而言非常的大。他只能通過MCTS隨機的走法搭配上價值網路來判定他算到的走法勝率有多少,而因為無法窮舉變化,所以在局面複雜的時候漏掉正解圖的可能性增大,所以此時它下出壞棋的概率比局面相對簡單時要高。
對抗alphago,如果我們不談利用AI莫名其妙出失誤的話,可能李世石這種力棋風格並不太適合。暴力圍棋的勝利大多數情況是因為對手的誤算,而因為暴力圍棋帶來的心理壓力過大,人誤算會出現的比較多。李世石即便是在巔峰期,也經常是在不利局面下以殭屍流亂攪利用對手失誤而翻盤的。我們看到雖然AI應對殭屍流效果也一般情況,但是在雙方扭殺在一起時的錯誤率比人實在低太多了(參見第一局和第三局從定式發展出的大規模戰鬥)
像李昌鎬那樣布局平平,主要靠官子取勝的棋手也可能不太適合對付alphago,因為至少目前我們發現alphago在棋盤變小之後失誤率也很低。但小李畢竟沒有跟alphago拼過官子細棋,alphago的官子到底怎麼樣其實還未知。
柯潔,朴廷桓,甚至是當年巔峰期的聶衛平,根據目前的研究,他們的風格比較適合對付alphago。首先這幾個棋手的特點是全面,沒有明顯短板,棋風很正,並不像時越羋昱廷這些典型的力戰派棋手一樣主要依賴力量取勝。從目前幾局較量來看,人類對於布局的認知已經達到了非常先進的水平,李世石並不是布局高手。像柯潔這樣的棋手布局對抗alphago應該會有小優,而alphago因為每步棋都是靠搜索然後選點,導致它不可能出現長遠的謀劃,因此它無法變成攻擊手。
額,話說回來,聶老後半盤得多吸點氧。。。。
猜測1:
為什麼這個alphago酷愛定型?小目托退之後很快就尖刺這種棋AI什麼怎麼算的?首先我們講一個事實。就是當給定的空間越小的時候,AI的計算力體現的越極致,MCTS演算法並非窮舉,但是棋盤越小,它應該是越接近窮舉。這有兩個事實可以體現AI在小的封閉局面下的戰鬥力:
1. 羅洗河老師提到過一個專門解死活的AI,這個AI遠沒有alphago這麼強大,但是在這種局部的計算力上差別並不大。在周圍被封死的情況下,這個AI做職業級死活題的正解率極其高而且相當快。但當這個棋周圍呈半開放狀態時,AI基本上完蛋。
2. 9路棋盤職業高手很難戰勝ZEN這種水平的AI,而ZEN和alphago一樣,本質上是MCTS。那麼我們舉一個特殊情況,在布局第四五手的時候,棋盤其實空空如也,AI找到的招法裡面,勝率取最大的點實在是太多了。反而當他早早地就跟你做定型交換的時候,相當於是棋盤上出現了一串連在一起的厚壁。我猜測是厚壁的出現,就起到了縮小棋盤的作用。所以當他跟你交換的越多,棋下的越厚的時候,它相當於安全地縮小了棋盤,縮小了計算的複雜程度。這種情況下棋盤上可選擇的」高勝率點「其實跟局面混亂打散的時候比,要少的少。那它選擇的棋就會離」最優解「較接近。
那麼我們就可以解釋為什麼AI會下出第二盤凌空肩沖五路,第四盤凌空單靠無憂角這種棋來了。它就是想定型。因為根據它的價值判斷,你的地還是你的,我肩沖之後無論你貼還是長起,雙方必然形成一根棍。在它判斷出來的雙方形勢中它是不虧的,因此是在一種不虧的情況下縮小了棋盤的下法。當棋盤繼續被它這麼縮小到一定程度的時候,人的棋就開始慢慢開始跟不上它的計算力了,因為它的這種計算註定了它對厚薄、外勢這類虛的東西比人的判斷要精準。
而人是不這麼下棋的,因為人有風格。比如攻擊型棋手,喜歡布局把自己下厚,步子邁小,縮起拳頭來再進攻。當年的本格派棋手,則是通過自己對於棋型和布局的理解建立微弱優勢,然後像alphago一樣多做定型,消滅變化,從而把微弱優勢保持到終局,小林光一就是以撈取實地然後快速定型縮小棋盤來保持優勢的典型。為什麼當年日本流行的本格派棋手,和90年代以常昊李昌鎬這種風格的溫和下法,被現在的力戰派棋手取代了?是因為本格派棋手下棋的時候,為了棋型的美感和厚重,招法節奏太慢,效率並不是很高,聶衛平曹薰鉉開始的棋手雖然改良了對於棋型的拘泥,加快了布局節奏,但是在局部對殺上還是難免有失誤。而且韓國棋手崇尚局部暴力攻殺,對局時給對手的心理壓力和計算壓力極大,力棋獲利有相當數量是建立在對手計算失誤之上的,本格派棋手經歷過的對殺強度不如韓國棋手,所以在局部很難招架。就連李昌鎬無敵的年代,他的兩大剋星依田紀基和劉昌赫,也是以殺著稱。
而你如何去攻擊愛定型的對手呢?就是不要給他定型的機會。他要求定型的時候,我就直接反擊。想想看,雙方布局掛角拆邊,一塊塊都下的很瓷實,大家基本上只能去比拼對」虛「的棋的掌握,比拼布局方向,以及後半盤收官了。你是攻擊型棋手,你就不應該讓對手結結實實無處下手,尤其當對手是李昌鎬朴永訓這類官子天王的時候,作戰思路就是中盤直接暴力解決,至少你不能讓他舒舒服服平穩拖到後半盤。
還有一個猜測,目前單純根據第三局和第四局,不知道是否是對抗alphago(至少現在這個alphago)的辦法:
我們通過第三第四局發現了非常大的問題,就是alphago應對殭屍流攪局的能力不好。第三局本來根本不會出棋的封閉局部,反而被李世石倒騰出一個打劫殺。第四局那步所謂的」神之一挖「更是有好幾種解法,而AI沒有直接應對錯誤,因為AI選擇的應對方法要想不出事,就需要自己製造一個打劫,然後不打這個劫直接和下方的白棋進行轉換。結果因為AI完全不懂得利用打劫而出現了意外失誤。
這裡我講解一下那種」神之一挖「的誕生思路。答主當年也是個翻盤專業戶,極其擅長在大龍已死的時候死馬當活馬醫,用逆向思維製造對手失誤從而翻盤,所以我至少可以講講很多棋手是如何構思出這種匪夷所思的棋的。
一般當要救死掉的大龍,或者利用對方的某些斷點進行突破的時候,直接斷上去,直接吊過去因為意圖太明顯,都會被對方輕易化解掉。所以我們要做一些必然性的計算,就是比如我用一串命令性的走法,類似於我打吃你就得粘,我沖你就得擋之類的近乎必然的招法,計算這個棋如果我們直接下手,棋會發展到什麼位置上去。那麼我就在這個離著戰鬥起始點有一定距離的點放上一顆棋子,如果對方在周圍某個或者某幾個特定位置沒有子的話,相當於當戰鬥以必然的態勢蔓延到這裡時,我這個子就會起到幫助,從而扭轉局面。
往往這種子在非常莫名其妙的位置又看似對其它位置的棋有攻擊時,最適合用來下這種」神之一挖「,因為從視覺上很難讓人直接聯想到這步棋跟你策劃好的那個起攻點有關。為了更好地掩蓋這種戰略意圖,人類甚至會在其它更莫名其妙或者能夠間接對這部棋起幫助的地方試應手甚至是分散對手注意力。一旦對方在應對的時候沒有發現你那一串設計好的進攻套路,而沒有把棋下在其中某個可以阻截這串手段的位置的話,對方就中套了。
然而計算機是沒有邏輯可言的,它並不會看到你的這步棋的位置來懷疑你在謀劃什麼。它只是用MCTS又去做了一大堆隨機搜索。萬一它沒有搜到你計算好的那一個變化圖,那估計就有可能要中招了。
問題就來了,第三局被李世石攪出劫殺,第四局AI莫名其妙送大禮。到底是因為MCTS搜索的圖中沒有李世石預先想好的變化圖?還是單純因為不懂利用打劫,以及不在非打劫不可的時刻絕對不動劫,造成的無正解可選。抑或是它的形勢判斷出了問題,剛剛被李世石出棋的時候認為點目還是自己優勢導致了自己一串莫名其妙的下法?
希望有研究過圍棋AI的朋友一起討論。開局變化是最多的,這有可能是計算機目前沒法深算而一流棋手做得更好的
中盤打劫,甚至三劫循環這種可能是計算機目前還不懂得正確處理的,如李世石這樣的水平是有能力刻意做出這樣的局面的收官,除了打劫,恐怕這是計算機最容易做得完美的,比石佛更精準不是夢,作為人類表示壓力很大如果李世石需要花大量精力考慮上述策略才能穩贏AlphaGo,說明AlphaGo的確有了不俗的職業水平,計算機戰勝圍棋第一人也就不會遠了。個人感覺現在AI還不到能讓我們疑惑「我們如何才能戰勝XXX」的程度,或許幾年後再回答這個問題才更合適一些。想起很早之前一篇載於《科幻世界》的小說,當初看的時候感覺很有意思,叫《唯美》,現在可以引用幾段正合適:
「我要黑棋,可以嗎?」我揭開了棋碗的蓋子。
「當然可以,難道猜先你們人類就能贏嗎?選棋一直是你們的權利。」 我笑了起來:「世界之所以美妙,是因為我看見了大海。」「你說什麼?」SCDDP618有些疑惑,「和棋有關係嗎?」
「沒有。我們開始吧。」我開始布子了。不是任何一種現在流行的開局模式,我更不會去計算布局的優劣。面對著計算力與判斷力遠勝過自己的對手,這沒有用。
-----------------
「你很高明,用了很古老的開局,這是他們的後期演化的資料庫里沒有的。但是-」他提高了自己的語調,「下午的時候,它的資料庫里將不再缺少相關資料!」
「那又怎麼樣?你認為人類的大腦真的能在計算力和判斷力上戰勝AI?我們的本質決定了那是不可能的。我是用那開局並非因為它古老。」 「那是因為什麼?」 花園裡各種鮮艷的色彩,很美,就像那開局,讓我想起妻子和女兒來。
-----------------
我不知道AI現在是什麼感覺,但是我的感覺很美妙。
沒有爭鬥,沒有計算,不存在所謂的外勢與實地的選擇。棋盤上,只有一種東西在流動、延續,我把它叫做美。 我沒有刻意去下任何一步棋。儘管棋盤上歸我統治的只有一半,但是無論AI如何布子,我都按我的思路將它向美引導。SCCDP618的表情開始有些難看了。當它發現事情有些不對勁的時候,它很想攪亂局面。它想祭出勝負手;它想對殺;它想征子;它想尋找劫材;它想棄子爭先,它想很多,但它做不到。我一一化解了它所有的可能。 ......老師是對的,這是與計算、判斷、經驗遠在自己實力之上的對手抗衡唯一的方法。將一切簡單化。當一切選擇變得幾乎沒有必要計算的簡單時,對手空有比你強大的能力,又能如何?
-----------------
SCCDP618終於嘆了口氣:「我們只能寄希望於你失誤了。」
「可能性很大,人的錯誤率是很高的。我記得在三百年前和你們相比就是3000:1的錯誤率。」我不知道,這是否算是安慰。 「從第一天開始,正如你所言,你就開始走向勝利。」它的聲音有些沮喪,「但是我還是會儘力的。因為我們不會出錯,而你只要應對不善,還是會輸的。」 我不會輸的。我告訴自己,堅持美的信仰,美是不敗的。
如果說1997年IBM深藍戰勝國際象棋世界冠軍卡斯帕羅夫是機器突破了人類的第一道防線話,2016年AlphaGo是不是摧毀了人類的最後一點驕傲呢?
雖然作為多年的AI工作者,是AI的堅定支持者,我還是覺得人類的最後一道防線可以多堅守一段時間。那麼,我來給李世石出點招吧 :)
這一切的一切,還是得先從AlphaGo的原理講起。
----------- AlphaGo的原理 -----------
區別於國際象棋靠推演,圍棋需要靠「感覺」。圍棋變化太多了,每一步棋可以有多達300多種選擇。僅僅推演6-7步,就已經是現在計算機所不能及,更不用說人。所以,即便是人,在很多場景下都要靠感覺來決定下一步往哪裡走。這種「感覺」,靠的是智力。
AlphaGo基於當今最領先的「深度學習」技術,來建立機器的智力。當前的這種人工智慧技術,是一種仿生學技術,運用數學模型去模仿人類的大腦。這種機器大腦,在面對棋局時也可以「感覺」出情勢的好壞。而「感覺」的好壞體現的就是智力水平。
那麼,智力水平怎麼比拼呢?通常我們數「腦細胞」的數量。就像人的腦細胞比狗多,所以人比狗聰明;狗的腦細胞比蟑螂多,所以狗比蟑螂聰明。4年前,Google就研發出了一個腦細胞數量達到百萬量級的大腦Google Brain,能識別出貓臉。為此Google動用了1000+台伺服器。
如果要讓機器大腦更聰明怎麼辦?一個直接的辦法就是,增加伺服器。伺服器數量增加10倍,腦細胞數量就能增加10倍,機器大腦就更聰明了。
所以,AlphaGo有多聰明,主要看它有多少「腦細胞」。「腦細胞」的數量,主要看投入了多少計算資源。
----------- AlphaGo的有多厲害 -----------
AlphaGo的智力水平肯定是不如人的。
4年前的Google Brain,腦細胞數量是人的萬分之一。雖然時過進遷,但Google的投入仍然不可能達不到當年一萬倍。從第一盤比賽中,也可以看得出來,李世石在開局和布局是佔有優勢的。
第一盤棋中,真正讓人感到害怕的也不是AlphaGo的棋力,而是它的沒有情緒、不知疲倦、沉著冷靜。這與AI無關,是機器的本性。
情緒、體力、心理波動等人性弱點對棋局結果的影響不可低估。事實上,李世石並不輸在棋力,而是輸在獲得優勢以後的輕敵,以及之後所犯的錯誤。
----------- 李世石還有機會嗎 -----------
雙方對比來看,李世石比AlphaGo聰明,棋力更深厚。AlphaGo比李世石的人性弱點:情緒控制更好,它不會緊張,不會嘚瑟,不會沮喪,也不會體力下降。李世石面對的其實是一位棋力比他稍差的忍者。好在,他是佔據主動的一方。在棋力佔優的情況下,只要不犯錯誤,是可以立於不敗之地的。
即便第一局失利,綜合來看,我仍然看好李世石。
和AlphaGo對抗時,人類需要注意的是:
- AlphaGo所基於的人工智慧技術,強項不在於推演,而是借鑒過去見過的局面。所以,如果要擊敗AlphaGo,需要儘可能把局面導向歷史上沒人下過的棋。
- 圍棋的邊角戰鬥靠計算,中空戰鬥靠感覺。既然感覺佔優,那就一定要盡量把勝負手留在棋盤中間(或許武宮正樹更適合pk AlphaGo?)。靠做「勢」取勝,而不是把戰火引到邊角實地。
- 一旦進入到局部纏鬥,儘早將局部肉搏戰打完,不要留出大量小區域短兵相接的局面,保持局面儘可能大開大合。
此外,需要格外小心的是,一定要克服自己人性的弱點。局面領先時,避免驕傲;落後時,避免氣餒;膠著時,避免緊張。李世石如果能在後面幾局注意控制自己的心魔,相信後面還是有很大機會可以搬回。
總的來說,要戰勝AlphaGo:1. 準備一些歷史上沒下過的布局;2. 把勝負手留在棋盤中間;3. 不留短兵相接的局面; 4. 控制自己的心魔。
還有一點,可能是李世石犯的錯誤,但已無法改變了。據說,他要求下快棋。AlphaGo系統的分為兩個部分,一是學習,二是對弈。其中,學習的部分是最耗時間和資源的,而對弈部分相對計算沒那麼大。要限制AlphaGo,應該要限制它的學習時間,而不是對弈時的思考時間。特別是,對於AlphaGo這樣的分散式系統,Google完全可以通過增加一倍伺服器數量來讓落子速度倍增,而李世石是不可能給自己的大腦擴容的。其實,最好的限制AlphaGo的辦法是儘早與他對弈,不讓他繼續學習下去 :)
據說,柯潔已經發話說,AlphaGo下不過自己了。如果柯潔要鞏固自己的優勢,建議:1. 儘早與AlphaGo對弈;2. 下慢棋。或者還有一個不靠譜的招:改一下規則,下20*20的棋 :)
----------- AlphaGo花了多少錢 -----------
最後,我想一個有意思的話題是,AlphaGo到底花了Google多少錢:)
從今天雙方在棋力上的差距來看,差距已經不是很大了。只要Google願意多投入5-10倍的資源,AlphaGo的棋力應該可以超越人類了。要達到這樣的智力水平,我想Google應該至少投入了數億美金的資源。
隨著技術水平的提升,和投入的加大,大概只需要1~2年,AlphaGo在棋力上應該也可以超越人類。
寫到這裡,我其實還是很羨慕AlphaGo團隊的科學家的,他們有一個很好的sponsor,能給他們一個環境去完成一件劃時代的壯舉——我何嘗不想擁有這樣的環境。
不過,後來我也想明白一個事情。其實我們的大環境缺的並不是有理想有抱負的科學家,而是sponsor。所以真正挑戰人類的其實是IBM,不是許峰雄;是Google,不是DeepMind團隊。就像,真正修成聖彼得大教堂的,是天主教會,而不是米開朗基羅。
這也是為什麼,我覺得還是要做一個公司,用商業的成功帶動科技的成功。分支搜索仍然是alphago工作的關鍵原理。
依託於當今的強大硬體和海量的數據再加上神經網路的輔助計算機很容易在局部或是步數不非常多的戰鬥中形成自身高可靠的價值判斷網路,具有了遠高於人類棋手的棋力。最近三盤的戰鬥中也可以明顯看出alphago確實具有這種棋力——————————————————————————————————
但是無論是分支搜索還的神經網路,
他們在根據戰略或是長遠價值確定行棋位置時都是比較困難的。而且下棋時的盤面與棋子的價值體現的盤面之間相差的步數越多越顯乏力。而通過人類的經驗和人類強大的邏輯分析能力,更容易解決這個問題。事實上人類也確實做的很好。
這突出表現在人類存在有效的序盤布局理論。布局理論經過人類長期的總結和檢驗已經非常可靠。而alphago很難通過自身學習和演練準確獲知並理解這些理論。按照現在的圍棋理論,通過這三盤棋可以看出
alphago 也確實在布局階段存在漏洞。alphago甚至是在和人類下開局之後的讓子棋它似乎只是憑藉自身強大的中盤,和尾盤能力,並不在意自己在序盤階段的落後。當然這可能是人類一廂情願的幻覺
alphago也許早以按照自己在中盤和尾盤的戰鬥力建立了,和自己計算力相稱的比人類更高級的布局理論。倘若果真如此alphago的棋力已經遠遠的超出了人類水平人類也就真的沒有任何機會可以戰勝alphago——————————————————————————————————
另外人類對alphago還有一些輕微的優勢:
在走棋之前如果人類沒有算清,alphago多半也不可能算清但走看不清的棋,alphago是樂於見到的,因為電腦比人類的計算能力強,這有利於alphago建立優勢。蒙特卡洛演算法實際上也是給了電腦犯錯的機會這在理論上是存在,尤其是在下圍棋這種變化複雜的棋的時候但我們不了解alphago,不知道這種機會小到什麼程度這一點並不是說要利用電腦的失誤,主要是建立人類戰勝alphago的信心——————————————————————————————————
綜上分析,我覺得要在近期戰勝alphago
首先要在思想上堅信alphago在布局階段的理論仍然落後於人類然後可以嘗試下面的做法1,宇宙流,或者在前幾招在天元附近下棋。布局階段將alphago引入電腦不熟悉的盤面。這樣才能將人類在布局階段的理論優勢充分發揮出來。2,不要過早的在局部陷入和alphago的糾纏
避免和alphago角力,不然會被帶入alphago的節奏,越走越複雜,讓alphago可發揮自己局部計算的強項。逐步建立起穩定的優勢不要幻想alphago會和你做簡化處理,這時你退一步,它只會逼的更緊直到人類因局面計算過於複雜而犯錯3,追求極度的行棋效率。
不要過於在意棋的死活和安定,可以在盤面上多搞幾塊自己半死不活的棋。然後在中盤和尾盤階段,強行創造打劫,和電腦打一個劫材眾多,且遍布全盤的生死結。要麼死的很慘,要麼戰勝電腦,不要中間態。破斧沉舟,尋求一擊必殺電腦的機會。——————————————————————————————————
昨天又看了第4盤比賽,覺得alphago在布局階段的優勢的情況下,反倒大失水準。
現在看來,人類的實力還是可以抗衡alphago的。我上面說的第3點嘗試,是孤注一擲的搏命建議。現在看來完全不需要進行那樣危險的行棋。不過可以嘗試在開局時讓alphago 佔得優勢,然後在alphago 運營自己的開局優勢的過程中,尋找機會擊敗它。如果我對第4盤勝利原因的的判斷不錯如何看待李世石VS阿爾法圍棋人機大戰第四局李世石第78手的「神之一手」? - 213 的回答李世石只要在50到100手中製造劫爭,第五盤就可以輕鬆取勝看了這麼多的分析。個人猜測目前阿法狗的最大弱點應該是在對贏棋的定義上。
大家都知道,電腦所謂的思維就是計算最優解,並落子在可能贏棋概率最大的地方。而大家都忽略了一件事。那就是何為贏棋?小勝幾目算贏棋,盤面屠龍造成的大面積崩盤而中盤獲勝(這裡科普下,李世石輸的這兩盤棋都是因為最後盤面目數不夠而投降的。對於業餘棋手來說,其實也可以下完後數子的。只是職業棋手覺得沒那個必要罷了,而這裡所說的中盤取勝那就是真正的盤面崩盤而落後太多。)在我看來,阿法狗認為只要最小限度的贏,即為小勝就可以。這裡從這兩盤棋中也可以看出來。最後阿法狗下的奇穩無比,而並不像人類一樣,如果可以多贏一點就多贏一點。往往這種心態會造成人類在必贏的情況下被翻盤。而阿法狗則不會。電腦只會認為我贏了就可以了,幹嘛還去贏你更多?所以我在這裡做出一個大膽的猜測。那就是阿法狗其實是遇弱則弱,遇強則強!這也能很合理的解釋了在對陣樊麾時所表現的棋力和對陣李世石所表現出來的棋力的驚人差距。如果真是這樣的話,那麼我覺得我們人類就可以在這個方面上動動腦經了。其實我認為李世石第二盤的戰術可以加以調整。比如在布局就稍微落後阿法狗一點。至少讓它這麼認為。然後看準時機等待阿法狗下出緩招(這是必然,因為上面推斷成立的話,電腦所期望的就是穩妥的取勝。這樣必然會下出緩招。)然後李世石可以趁機翻轉形勢。但是這裡要注意一點,一但形勢翻轉後,情況就不允許人類這方出半點差錯,必須直到終盤都應對的完沒無缺。這樣理論上可以戰勝阿法狗。)------------------------------------------分割線-------------------------------
這裡補充一下。電腦對贏棋的定義也只是停留在0和1的差別上。它不會因為險勝你而感到興奮,也不會出現殺得你片甲不留的爽快感。正是因為它不具備人類的感情,所以它會始終只保持到達1就行了,而不會考慮1後面的事。
所以如果以上假設成立的話,整個這件事感覺真的就是谷歌為了借圍棋這個媒介來搞了個大新聞罷了。這個大新聞就只證明了一件事,那就是人類的計算能力比不上機器。可這還需要證明嗎?計算器的誕生不是已經證明了嗎?
-----------------------------------------3月13日更新-----------------------------
首先,今天要恭喜小李取得了首場勝利。我相信大多數圍棋人士跟我的心情是一樣的吧。
看了今天這盤棋,我感覺阿法狗在逆勢下的拼搏只能用低劣來形容了。我原先還認為人類後半盤處於優勢後需要不犯任何錯誤的情況下才能贏阿法狗,看來我高估了阿法狗了。這裡我先放出我的新觀點,也希望以後能被打臉。
就是:如果,谷歌不開發新的演算法,只是靠目前的演算法而讓阿法狗繼續練習的話。我敢肯定,十年過後,阿法狗一樣沒法戰勝人類頂尖棋手。接下來我來分析下我的觀點。
首先,阿法狗在第4盤中,劣勢下的抵抗讓人大跌眼鏡。很多人都不敢相信,我認為小李自己都不敢相信自己會被阿法狗先贏三盤。這個問題也是我認為在目前演算法是沒法解決的致命弱點。意思就是阿法狗只會下優勢局面。優勢局面它對形勢的把控可以到完美無缺。 但只要是中後盤讓阿法狗進入劣勢,它變不會應對了。我先來講講劣勢形勢下,人類通常的應對手法。那就是下出勝負手。而往往勝負手是比較過分的一手,通常情況下,應對正確是沒什麼問題的。恰恰關鍵的地方就在此。演算法的弱點也在此。因為這裡牽扯到一個心理博弈的概念。就是我要賭對方下錯棋,這樣我才能獲勝。而阿法狗他不知道它下的哪一步會使人類更容易犯錯。這就導致了阿法狗在第四盤中,下出了那麼低劣的棋了。因為它只看概率。我走這一步,如果你不下,我贏,你下則我輸,對他來說勝率是50%。殊不知對人類來說就是圍棋常識。因為阿法狗根本就不懂圍棋!那麼我相信只要在開局建立優勢並保持到中盤,差不多阿法狗就要開始犯二了。心理博弈這個層面,我相信才是人工智慧要攻克的最大難點。我寫了一篇文章提出了AlphaGo的漏洞:AlphaGo的漏洞分析 - 知乎專欄。 內容如下:
圍棋AI為什麼難做?公認的兩點理由是:搜索空間大、局面評估難。
AlphaGo為什麼厲害?因為它很好地處理了第一個問題。面對搜索空間大的問題,AlphaGo通過策略網路,使得選擇搜索分支時有了很強的針對性。但我認為AlphaGo還遠遠沒解決準確評估局面的問題,因為它是基於蒙地卡羅法做局面評估的,這會導致它在評估局面時出現致命的漏洞。下面我會用通俗的語言來做說明,小學生也能看懂:
蒙地卡羅法是一種用隨機數解決統計問題的方法。用在圍棋的局面評估上,就是將圍棋的局面評估問題看成一個統計問題。電腦評估一個局面好不好的時候,隨機下子,直到棋局結束,如此重複多盤模擬對局,看看勝率如何,勝率高的話就認為局面是好的。也就是說,它認為模擬對局的勝率高就是局面好。
但是在某些情況下,這是不成立的。如果接觸過象棋殘局的話就會知道,象棋殘局通常只有一個走法可以贏,走其它著法都會輸,勝率是很低的,但只要走對了就是必勝的。因此,勝率低不等於局面差,勝率高不等於局面好。這就是蒙地卡羅法必然有漏洞的原因。
AlphaGo模擬對局的方法建立在蒙地卡羅法之上,但有所改進,並不是隨機落子,而是落子在一些較好的位置上,但依然是用勝率來判斷局面的優劣。前面論證過,勝率高不等於局面好。因此這一定會是AlphaGo漏洞。
AlphaGo的局面評估運用了兩種方法,一是實戰時的模擬對局,二是價值網路。蒙地卡羅法的問題不僅僅表現在實戰時的模擬對局,也波及到價值網路,因為價值網路是通過實戰前的模擬對局產生的,同樣是根據勝率來判斷局面的優劣。
我認為小李這倆月的準備非常關鍵,不僅需要來自圍棋屆的幫助,也需要來自機器學習專家的幫助。
先說機器學習專家這邊,必須有這方面的專家來告訴小李並讓他初步理解這個AI工作的原理,可能產生弱點的地方以及他可能強的地方。這人最好也比較懂圍棋,這樣可以講得更清楚,例如舉點實際例子跟小李討論它背後可能是怎麼「思考」的。
限於保密,除了論文大家對電腦了解還很少,無數人特別是職業棋手肯定是都躍躍欲試的想要去試探電腦。從公開棋譜看,樊的策略是第一盤求穩第二盤開始試探性的,大方向正確但是測試難度太低沒達到效果。所以第二方面是圍棋屆能給小李的幫助是,選擇和確認一些布局或局部手段,特別是不常見或者推翻了以往看法的。這樣可以大大提高試探電腦的有效性從而發現其弱點,只是這種選擇也需謹慎,明顯無理欺負下手和以前電腦的那些招法我認為不明智,跟這樣的電腦下我認為最忌諱的是很早就落後。基於其學習原理和圍棋如此之大的搜索空間,我不認為短時間它會有飛一樣的突破,所以立足不犯錯但兼帶足夠強度對電腦的試探,以小李的敏銳絕對有機會發現其弱點。
基於我對機器學習模型的認識,我認為其最大特點是中庸,而這恰也被公開的棋譜所驗證。中庸意味著不怎麼犯錯,這是電腦最大的強項;但同時也意味著他找到的並不一定是全局最優的方案,因為他它不是窮舉或數學證明得到的最優,是基於樣本的最優,所以AI的選擇也許每一步都可以是佔大多數職業高手的選擇,但多數並不等於正確。小李這種特立獨行,引領時代的人,一定是有些異於常人的思維之處,往往真理也許是在少數手中。所以,我才認為立足於不犯錯對小李更重要。仔細整理一下思路吧。
我說「計算機的棋感理論上可以遠超人類,因為人類的學習量頂多100年,電腦的學習量可以是上千年、上萬年、上億年」。
他則用AlphaGo的那100w局棋是胡下的來反駁我。問我1步棋需要幾秒,大概是要暗示我講的那個學習量是不可能實現的。Google是因為剛剛在嘗試這種技術,自然不會有那麼多時間模擬出大量的職業水準的棋局。
看到「理論上」三個字了嗎?我說的是計算機,也沒說AlphaGo。你用一篇幾個月前的論文來反駁我根本就莫名其妙,即便是AlphaGo也可以改進生成棋譜的方式,而不是只能用胡下的棋譜訓練自己。100w相對高質量的棋譜完全有可能用比較短的時間生成出來,即便只用人類專業棋手的棋譜,也是個不小的數字,這些並不是什麼垃圾棋譜。我能想到的可能戰勝AlphaGo的方法:
1、讓柯潔和AlphaGo再進行一次人機大戰。
2、把AlphaGo放在網上,任何人都可以投票來決定如何下子(但可以給職業棋手單獨賦予遠比普通人高的權重),然後每天0點到23點,人類下一步,23點到0點,Alpha Go下一步,不知道這樣有沒有希望贏……首先誠摯的佩服阿法狗的實力。
但回頭看看我這篇文章,第四局李世石的不成立的」神之一手「難道沒有讓電腦死機么?事實證明,阿法狗的命門就在局部計算,只是他的大局觀過於出色,掩蓋了這點。如果再讓李世石下10盤,勝負真心未可知。實際上,第四局阿法狗已然失敗,他的官子依舊是虧的。這就有力駁斥了alphago的臭棋只在求穩時出現的傳言。阿狗的棋遠不完美,也不可能通過圍棋上的圖靈測試,他喜歡有事沒事就在人的空里走棋,雖然不虧不賺,但人類是不會這麼走的。從這幾盤棋來看,阿法狗依舊沒有連續性的思維,他就像個加強版的zen,從人的角度來看,就像極了雨人,一方面計算力很強,一方面又是白痴。阿法狗的實力遠遠超出我的想像,這個要承認,但李世石不能代表人類,尤其是這5盤棋,下得真心不怎麼樣,唯一的神之一手根本就是不成立的。
我也立個flag,我認為李世石不出現大勺子的話,可5:0勝阿法狗,一般情況4:1勝。並且,圍棋界頂尖棋手的反抗將遠遠超過人們的想像,尤其是IT界的預期。為什麼?我隨便講幾點。
1.蒙特卡洛程序計算雙面怪劫慘遭斷線去年11月,電腦軟體冠軍「石子旋風」中盤不敵連笑(全國冠軍,職業七段),且被讓了5子。有趣的是,盤中右下有個雙劫,電腦算著算著就「斷線」了。實際上,斷線歸來後,「石子旋風」照著一個類似循環劫的怪劫連續提劫,越走越虧,越虧越輸到了姥姥家,確實也惹得「名人」連笑是連連發笑。2.阿法狗的硬體實力很強,但軟體方面沒太多新意,蒙特卡洛存致命弱點
當然,諸如zen、crazystone等軟體,如今已經成了背景牆。谷歌讓其4子勝率也有77%以上。但論本質,google的阿法狗並沒有脫離這幾款軟體的設計思路:蒙特卡洛+博弈展開。google論文改進為策略神經網路和值神經網路。對此,余平教授認為,google的演算法並沒有什麼大的新意,全靠公司強大的計算資源在撐。與石子旋風相比,google準備對陣李世石的核心數將達到駭人聽聞的2000核!是石子旋風的30多倍。但計算力再強,一旦陷入死循環會怎麼樣?會不會也「斷線」?我們拭目以待。3.計算機對「味道」、適應手等全局的邏輯判斷無感
youtube昨日全球直播,金明萬七段與google工程師andrew一起直播解構alpha-go。金明萬表示,首先,這個阿法狗不可能下得過他。然後,這個alphago的計算力並不深遠,據說測試版只能算20步,一線職業棋手計算50步以上是家常便飯。且對於味道、適應手等完全無感。最後,他認為,哪怕機器自學幾億局也不能學會真正的棋感。計算機沒有具備真正的大局觀。======================================================因被舉報「不友善內容」修改(確實開罵了,這點要反思。心態不好,應該改進,把罵人的話刪掉,留了討論問題的話,且語氣修改得委婉些了)1.我問他幾秒一步,不是說跟他鑽牛角尖或挑,而是想說明一些問題。倘若,他回答2.5微妙一步,我說錯了,是2微妙一步,這就是挑刺了。我意思不是這樣的。不管是2微妙也好,哪怕1秒一步也罷。棋的質量遠遠低於正式比賽,這是一定的。論文里也寫了只開神經網路是什麼水平。
補充1,針對 @付恆 認為30歲學圍棋也可能獲得世界冠軍。 這個我持保留意見,各位見仁見智,嘻嘻。
補充2, @付恆 認為,圍棋軟體的難度分為「hard/normal/easy「模式,所以他拒絕回答我alphago的default policy的用時。同時又說,「根據硬體不同,可能是幾百毫秒。」這個問題我有不同意見。
首先,hard/normal/easy一般是電腦遊戲區分難度的說法,圍棋里沒有這個說法。一般圍棋軟體的棋力分為kyu級和dan級。alphago目前來看更不可能分hard和easy模式。
其次,default policy的用時也不可能是幾百毫秒。這個可以簡單算出。一天是86400000毫秒,一手棋500毫秒,且一盤棋下區區200手的話。alphago一天可以下8640盤棋。而deepmind宣稱,alphago一天能下好幾百萬盤棋。我可以同時跟兩台AlphaGo下棋,而且保證至少贏一盤。
AlphaGo的原理有別於傳統超級計算機窮舉的演算法,模擬了人腦神經元網路處理事件的過程。神經元網路的強大之處在於可以不斷強化訓練,不斷進化,越來越強大。這種強大是相對而不是絕對的。模擬思維的過程也就放棄了計算能力強悍的優勢。對思維的模擬越完備,弱點就越大。終極結果是AlphaGo成功變成了圍棋世界冠軍,還是只能自娛自樂無法抽象出對局經驗傳授給他人的那種。越像人越好,至少還不是棋神,人類有機會戰勝它。而暴力窮舉的演算法,到計算機能夠輕易遍歷每一步的時候,人類是必敗的,因為所有可能棋局計算機都知道。 再說為什麼那麼下,AlphaGo不知道,它的製造者也不知道,一切都是神經元網路的訓練結果。演算法上的缺陷,並不是尋找最優解,而是尋找生存概率最大的解。這個過程中容易把偶然當作必然,某種下法在連續很多局裡都勝了,這種下法在決策里會取得更大權重。人類棋手對於下法,更多考慮的是優劣,這是經驗的總結。而AlphaGo參考的是優勢概率——每次訓練都是優勝劣汰的過程。 這種抽象不好理解,如果有做過金融市場策略測試的,或許能夠明白。使用類似的遺傳演算法,能夠得到各種參數非常nice的策略。可是拉長觀察時段,演算法並沒有帶來絕對的優勢。一個不合常理的走勢就輕鬆擊潰了訓練了n次的演算法。類似的橋段,《棋魂》里塔矢亮被一個棋藝很差的學長逼著下盲棋,結果完全不適應。多年的圍棋訓練並不能處理這種情況。同樣AlphaGo對非常規下法可能會有不適應,如果對局中出現一些複雜的手筋(步數超出AlphaGo計算深度的),AlphaGo必敗。個人觀點,擊敗AlphaGo的關鍵在於足夠複雜的手筋和打劫。人類棋手是有可能發現手筋的解法,即使很複雜(所謂的盤感和直覺),而AlphaGo並不能主動將計算資源分配到局部進行更深層次的計算(人類也會誤判,結果浪費大量的計算時間,AlphaGo則是從全盤多個地方進行規劃)。還有就是多用非常規下法打亂局面。搞點鬼手,適應手什麼的。訓練是不大可能大規模訓練到這類這些情況的。也就是說,這種局面下,AlphaGo是新手,也就沒有局部優勢策略,這時候更多的是在演算法決策下的「亂下」,或者脫先去別的地方下了。 五局棋里,也反映了AlphaGo的特點。布局較弱,中盤和官子較強。布局不是太差的情況下,對勝負更直觀的影響因素是中盤和官子。也就是說,AlphaGo並沒有足夠機會進化出更厲害的布局下法,通常戰鬥焦點在中盤之後。布局的訓練,對於電腦來說,還真的非常難,布局完成之後,後續的可能走法還是無窮多種。究竟哪種布局優勢更大,還需要更多的對局來訓練(話說AlphaGo你都下了3000萬局了,可對於圍棋的可能性來說,還是宇宙里一塵埃)。
斷網斷電
現在來看,準備沒下過的招發之類的反而是以自己短處搏ai的長處了,倒不如就遵循定式,走分析得最透徹的,集合人類千年的經驗去對弈
只要打開GreateFireWall,金盾,域名劫持,對谷歌展開DDOS攻擊,PLA黑客入侵alphaGo主機,篡改關鍵數據,中國人一定穩贏alphaGO
答案時間2016年3月10日16:33分。
AlphaGo 2 : 0 李世石。
回頭再看一下一個月前各個答主的回答,彷彿看到了愚昧自大的人類被人工智慧消滅前不可置信的眼神。來聊一下怎麼贏機器人?首先,本人挑戰機器人,圍棋水平業餘之業餘,我保證我和機器人下棋,我不會敗。方法是:在圍棋規則的基礎上加4個字,落子換盤。意思是落下一個子,需要換一個棋盤。雙方都可以換棋盤。公平合理,在雙方都同意增加落子換盤的基礎上來一局比賽。1.人類智商較高,所以機器先手,執黑棋,人執白棋。2.黑棋落一子,問是否換棋盤,機器的設計者說:不換。3.人類下一白子,並要求換棋盤,換棋盤時間為5分鐘。(人類問科學家要了一張機器人無法識別的棋盤,然後交給機器人。)4.機器人無法識別棋盤,無從落子,裁判判負。(機器人的設計師抗議,認為人類作弊,提出要修改程序,需要1天的時間,並問人類是否同意)5.人類同意給對方1天時間修改程序,比賽暫停6.第二天棋局開始,機器人被設計師修改了程序,可以識別棋盤,落下第二子。7.人類在棋盤上也落下第二子,並要求換棋盤(人類向科學家要來第二張機器人無法識別的棋盤)8.機器人無法識別棋盤,落不下第三子,裁判判負(機器人設計師要求修改程序,需要10天時間,並問人類是否同意)9.人類同意,10.機器人10天後又可以識別棋盤了,落下第三子11.人類落下第三子,要求換棋盤(問科學家要來第三張機器人無法識別的棋盤)12.機器人獃獃的看著棋盤,無法識別的棋盤,它無法落下第四子,機器設計師陷入深深的沉思,然後表示認輸人類能贏憑的是格局,既戰略意圖,商業模式。是智慧人類在與機器的較量中,用的棋盤是國家科技,手執的棋子是科學家,反觀機器是做不到的,它只能去計算棋盤的格子,用無數的數學邏輯,去計算方法。然後落子。就算設計師也請來科學家幫助,而那樣就徹底改變比賽的性質,變成了科學家之間的比賽,這樣循環下去,就是一場科技競賽。人憑計算能力,贏不了機器,可是人類可以改變規則來實現目的,這就是人類能贏機器的根本所在。思則變,變則通,不思不變必淘汰
推薦閱讀:
※從圍棋角度看李世石與 AlphaGo 的第二局比賽有哪些關鍵之處?
※類似 AlphaGo 的人工智慧在遊戲王、萬智牌等卡牌遊戲中勝率如何?
※如果AlphaGO級別的AI去玩爐石傳說,會怎樣?
※先有引力波,後有阿爾法狗,我們是不是站在大時代的起點?
※如何評價第四局比賽 AlphaGo 輸給李世乭?