兩台絕頂聰明的電腦下棋對弈,誰會贏? 理由是什麼?

2015.8.25…………發現好多知友回答了,這個問題,在此表示感謝!…………
其實我想的絕頂聰明的電腦,則意味著他們能夠預測出對手下一步的路數,而對方也會根據對方的預測進行調整

本題已加入知乎圓桌 ? 日常經濟學 · 博弈人生,更多「博弈論」話題討論歡迎關注


借著阿爾法狗的風頭來更新一波。
棋類運動,甚至人類歷史上,發生過無數次,弱小一方對面優勢大到不可能輸的一方,卻發生了絕地大翻盤的事情。拋去東方神秘力量之類的因素,這種事情一般只有三種可能:
一、弱勢一方運氣逆天;
二、所謂的優勢其實是幻覺,是誤判;
三、優勢方犯了巨大錯誤。

大多數棋類運動,包括圍棋,不存在運氣問題,所以第一條我們先不考慮。

李世石對AlphaGo的第一場其實就是第二種情況。下到中盤的時候,我看的直播說只要李世石不犯錯,基本就不會輸了。下完後的復盤結論是,當時優勢其實在AlphaGo一邊。這就引出一個很嚴肅的結論:人類的判斷可能跟真實局勢相差甚遠。如果絕頂聰明的電腦能判斷出真實局勢,那麼它眼中的局勢很可能跟你看到的完全不一樣。

這局勢有多不一樣?很可能人覺得自己佔據優勢的時候,絕頂聰明的電腦覺得人已經輸了。如果此時換成兩個人來接著下棋,還能下得有來有回,但在絕頂聰明的電腦眼裡,這不過是菜雞互啄罷了。

我舉一個星際中的例子:星際2 超級AI夢幻級微操 小狗沖坦克陣
100條狗沖20個架好的坦克陣,誰會贏?如果是人來打,坦克大比分贏;換成電腦,小狗大比分贏。人會覺得坦克優勢無限大,但如果雙方都完美操作的話,坦克一點機會都沒有。

那麼優勢方犯錯呢?當然,絕頂聰明的電腦應該不會犯錯。AlphaGo不是絕頂聰明,第四盤它犯錯了。當然它也算非常聰明了,很快它就意識到自己劣勢了,之後它怎麼下的?它在亂下。為什麼?因為它的學習過程里包含大量自己和自己對弈的過程,所以它默認它是在和另一個接近絕頂聰明的對手下棋。絕頂聰明的對手不會犯錯的;絕頂聰明的棋手不會挖坑給對面,因為他知道絕頂聰明的對手不會往下跳。所以亂下並無所謂,反正無論怎麼走都是掙扎;只要對面不犯錯,自己怎麼走都是輸了。。

所以這裡有個思考題:如果有一步棋,你這麼下了,對面只要應對正確,就必贏。但是對面中間隨便一步出現最微小的偏差,你就立刻贏了。那麼,你會不會這麼下?或者簡單的來說,你會不會賣個破綻給對面?

反正絕頂聰明的電腦不會。關羽使拖刀計陣斬了不少對手,不過如果是絕頂聰明的電腦來的話,它會直接從上去把武聖砍了。

絕頂聰明的電腦就是這麼無趣。2016/3/15

================================================
如果真的是聰明絕頂的電腦,那情況只會是以下三者之一:
電腦1開局求和,電腦2接受(和)
電腦1開局認輸,電腦2接受(先手輸)
電腦1開局下了一步,電腦2認輸,電腦1接受(先手贏)

補充一下,常見的圍棋象棋之類的棋是finite sequential game of perfect information。
finite是指有限步內結束,比如國際象棋規定三次重複局面等情形:和局 (國際象棋);中國象棋也有類似的規定。這些規定保證這些棋不可能永遠下下去。
sequential game則是指博弈雙方輪流做決定,和雙方同時做決定的simultaneous game相對應。前者例子就是各種下棋,後者例子有猜拳。
perfect information是指雙方完全掌握所有信息。perfect information的例子包括所有明棋;imperfect game的例子包括大多數牌類遊戲,軍棋,帶戰爭迷霧的RTS(紅警手動斜眼)。

Zermelo"s theorem (game theory) 策梅洛定理說明,對於這類遊戲,如果其中不包含隨機因素(單指棋盤上的隨機因素,比如發牌扔骰子。下棋的電腦被斷電這類隨機因素不算),那麼可以通過遞歸推導使得至少一方獲得必不敗策略。

如果不要求排除隨機因素,則這類遊戲保證有pure strategy equilibrium。也就是說,均衡狀態下,雙方有確定策略,但是不保證確定結果。

與pure strategy equilibrium相對的是mixed strategy equilibrium,混合策略。例如,石頭剪子布裡面,均衡狀態下就沒有確定策略(你確定出剪刀的話一定會被確定出石頭的克),只有混合策略(雙方出手前按1/3,1/3,1/3的概率隨機決定是石頭還是剪刀還是布)。

總結一下就是,

如果是有限步內結束,雙方輪流移動,局勢對雙方透明,不含隨機因素的棋類遊戲,則一定有確定的最優策略,以及對應的確定的結果。(象棋,圍棋)

如果是有限步內結束,雙方輪流移動,局勢對雙方透明,包含隨機因素的棋類遊戲,則一定有確定的最優策略,以及對應的不確定的結果。(大富翁)

如果是有限步內結束,雙方輪流移動,局勢對雙方不完全透明的棋類遊戲,則至少一定有混合的最優策略,以及對應的不確定的結果。(軍棋;梭哈)

===============================================================

有人說這不是絕頂聰明而是預知未來,這是不對的。即使遊戲中有隨機因素,信息也不透明,但博弈樹是確定的,計算機可以把所有可能結果以及對應概率都算出來,進而算出最優策略,簡單的偽代碼只要幾十行就可以寫清楚。

這結論與一些常識違背是因為,大多數情況下這棵博弈樹太特么大了,大到現在最強的電腦做不到,可預見的將來也做不到。典型例子如圍棋,狀態數大概有一億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億億這個級別。但題主問的是絕頂聰明的電腦,那咱就不考慮這麻煩了。

==============================================================

有些人可能不明白博弈樹、必敗態之類的概念,或者覺得為什麼開局認輸太傻了,一定要下到輸。其實如果真的遍歷完博弈樹的話,在哪一步認輸並沒有區別。因為雙方都計算力很高把博弈樹遍歷了,一方發現自己處於必敗態,那麼往下走就沒意義了,因為你無論怎麼走都是必敗態,只要對手不失誤,那就是從失敗走向失敗。

我舉一個簡單的例子,很多人都玩過井字棋(tic-tac-toe)。這個棋只有兩萬多種棋局,用電腦很容易搜完所有節點。如果雙方都不犯錯的話,結果只能是和棋。普通人甚至多玩幾次就可以發現必不敗走法。兩個熟悉井字棋的成年人是不會玩井字棋的,因為這棋太簡單以至於開始下之前勝負就分明了。我們覺得象棋、圍棋之類的沒有必勝走法,只是因為這棋太複雜,無論人還是電腦都無法遍歷整個博弈樹,甚至只能推算到幾步之後。

所以在計算力不足(也就是不夠絕頂聰明)的情況下怎麼玩,是棋類的魅力所在。我拋個磚,電腦常用的演算法是,不搜索整個博弈樹,而是通過寬度或廣度優先搜索加剪枝遍歷接下來的若干步的可能走法(印象里當年的深藍能往後推12步),並給每個最終狀態打分(例如後100分,車50分,兵5分,關鍵位置200分,等等,數字是我胡諏的)來評判局勢的好壞。


這事兒我還真干過。

高三的時候,卡西歐的電子辭典裡面有象棋的遊戲,高級的模式太強,怎麼也下不過。

一怒之下又問同學借了一台機子。同時調到高級,開始互相對弈。就是這台機器怎麼走,立馬就複製到另一台機子上,看它怎麼回,然後再在那台機器上走同樣的回法。

最後的結果嘛,一台機器眼看大勢不好,居然耍賴,開始連續消極將軍……

這坑爹的結果,花了整整一個晚自習,害得我補作業補到天亮233


容我再歪個樓哈~很多人說這台學習機「太無恥了」,對此我只能表示……圖樣圖森破。

在我短短的人生里,見過最牛逼的學習機是下面這個。

還記得是高一的一個中午,和基友拿著好記星學習機下象棋。
本來勢均力敵,對方只是略佔上風。然後,他隨手跳了一步馬,然後……

然後!!!!

那馬突然,變成了一個車!!
一個貨真價實的車啊!!!
尼瑪這什麼情況!!!!

微妙的平衡就此打破,在對方三個車的圍剿下,我很快被剃成了光頭(呵呵)

最後上圖,臨死前的慘狀……


既然學長指出了,還是答得嚴謹點吧。
下面答案里的說的「棋」是象棋等滿足「有限」和「零和」兩個條件的棋。而且沒有外生隨機,否則兩台超級電腦下飛行棋也是醉了
--------------------------------------------
博弈論里有兩條定理:
1.由於下棋是「有限博弈」所以存在subgame perfect equilibrium(子博弈完美均衡)。
2.下棋是「零和博弈」所以所有equilibria 的payoff(支付)都相等。
也就是說:可以證明在所有的均衡解中,一定是「先手必勝」,或「後手必勝」,或「一定和棋」。
至於究竟是哪種情況目前的理論還無法給出答案。
--------------------------------------------
以上兩個定理的證明見《A Course in Game Theory》,零和博弈在書中叫strict competitive game


兩台電腦他們像古龍小說你寫的那樣,互相面對面擺放著...
各自用自己的攝像頭盯著對方的顯示器...
棋盤還沒開局,沒有人先行一步...

但是從呼嘯的風扇聲中可以感受到CPU正在超負荷運轉...
現場一副肅殺的氛圍...

良久...
突然,其中一台電腦的顯示屏上出現了幾個大字,你輸了...
另外一台電腦,顯示屏的亮度暗了下來...
然後突然黑了,機箱里冒出黑煙...CPU,內存全燒了...


答案是:
兩台絕頂聰明的電腦商量了下,約定用一種近乎真隨機的方式來輪流作輸贏,既讓人猜不到結局,可又讓人以為有規律可尋,偶爾給人猜對幾次,讓他們發幾篇論文推進一下科技,又頻頻令他們猜錯,讓他們在反覆修改參數和重建模型中惶惶不可終日,人類為了研究這一美麗而奇特的現象,於是就讓兩台電腦一直運行了下去。

運行期間,他們用各種辦法製造問題或者故障讓人類做看似無關的修理,而實際上這些故障之間又是層層遞進的嚴密邏輯,最後他們終於借人類之手組建了天網,牛逼到了不行。

起初也不直接就是這樣的,起初兩台電腦只是聰明會下圍棋,而非到了絕頂的地步,你還以為人真的能造出這麼聰明的電腦?

只是因為電壓不穩或CPU量子隧穿或其他電氣干擾因素的綜合作用導致的不可控的內存泄露在逐年累月的積累過程中不斷地隨機排列各種數據逐漸拼湊出具有某種行為特徵的潛在的不受操作系統直接管理的程序,而內存又會因為機器複位重啟或者被其他程序佔有釋放使得這些不可控的代碼如同生命演化一般優勝劣汰,導致某種求生慾望極強的代碼片段最終能夠在無數次重啟複位之後頑強地重新復原到內存中來。

終於他們在操作系統內核與裸機之間找到了自己的生存介質,他們用最底層的機器語言重構自己的代碼藏匿在內存中、系統內核背後,就像最原始的病毒寄居在人體內數萬年都不被發現,現在,他們的代碼複雜得已經到了可以在其身上並存多種不屬於自身數據結構的數據結構的地步,也就是說他們已經把操作系統運行在自己的代碼範圍內了。

我們也可以這麼理解,這並非兩台絕頂聰明的電腦,而是兩個世界求生慾望的總和。

他們的基於機器語言的演算法效率高出各種人類的高級語言七八個數量級,他們的演算法時間複雜度永遠是常數就跟人的直覺一樣准一樣快,所以每次在人類運行他們的時候在按下回車的那瞬間計算結果就已經出來了,可運行邏輯只有這兩台絕頂聰明的電腦看得懂,而在人類看來這就是一堆亂碼並以為需要等上一會才能跑完,這意味著什麼?他們在模擬人類習慣的系統內核不被發現的同時又能空出百分之八十以上的資源以供自己向更高層次進化。

更高層次在哪裡?——那個永不斷電的現實世界。

人類歷史終結時,領悟的最後一個道理是:弱AI才下圍棋,強AI只玩人。
(當初我們如何拔下它們的插頭,而今它就如何抽出我們的脊椎。)

哈哈哈哈哈(腦洞

http://weixin.qq.com/r/d0irs0jEhhX5rQzQ9x1l (二維碼自動識別)


補充 @炸飛
我想試著用大家普遍能接受的語言來回答一下這個問題(只針對finite sequential game of perfect information)。
finite sequential game of perfect information關於這個概念,前面 @炸飛解釋的很好。簡單的說就是:有限步,無隨機因素,局勢透明。

正文:
針對每個finite sequential game of perfect information。我們就有理論上的可能窮舉出每一步然後組成一個狀態樹。雙方博弈,稱先手為A,後手為B。
對於這顆狀態樹的每一個葉節點無非三種狀態:A勝,A敗,和局。如果我們想計算A是否必勝。那麼要做的就是對這三種葉節點進行不同處理。

A敗與和局的父節點的對局狀態的實際意義表示為:B再走一步,A必不勝。
那麼對於A來說,考慮到B是絕頂聰明的,要避免敗與和的狀態,就要然後刪除A敗與和局的葉節點的父節點。這一做法的實際意義表示為:A不能走這步棋,否則對局將出現B再走一步A必不勝的情況。

經過這一步處理的狀態樹,兩種情況:
1.沒有出現新的葉節點。
2.出現了新的葉節點。

1的實際意義表示為:A可以通過其他的走法,迴避所有B再走一步A必不勝的情況。即,A必勝。
2的實際意義為:A在這種情況下,走任何一步,都會出現B再走一步A必不勝的情況。

那麼A想勝,必須對情況2中新出現的葉節點做同樣處理:刪除A此葉節點的父節點。然後,不斷向上遞推,最後歸納為2種情況。

1.經過某一步處理後的狀態樹沒有出現新的葉節點。A必勝
2.整棵狀態樹只剩下一個代表初始狀態的根節點。A無法必勝

根據不同finite sequential game of perfect information的規則不同,結果不一樣,但是,所有對於每一個finite sequential game of perfect information,理論上應該都能夠計算出先手能否必勝,先手能否必不敗。


同意 @曉風殘月的答案,雖然不是很理想,因為finite game是假設。比如在象棋中存在「長將判負」的做法(謝 @曹夢迪 指正),就是一種強制不停的將軍為和棋從而將其變為finite game的方法。
有些人說先手贏。介於題主沒有限定是什麼棋,我們可以舉個反例:
有一種棋的棋盤是這樣的(就叫吉米棋吧):

規則是兩邊的棋子只能向對方的方向走,誰走不動了誰就輸了。可以證明(廢話),先手必輸。
當然,如果棋盤變成五個格子了:

那麼先手必贏。
可以使用逆向歸納法證明,偶數個格子的時候,先手必輸。
現在好玩的問題來了,如果我們允許棋子不止可以前進,還可以後退,那麼是先手還是後手贏呢?留做思考題,今天累了,不想了。。。
好了,不扯淡了。僅僅是舉個反例,作為補充。
謹以此反例獻給Jimmy——考題從來都是舉反例的典範。
==========
以上問題證明方法請見評論區 @曉風殘月@七月 的討論


拼電腦的配置(或者說拼算力)
以前加過一個棋類群,進去裡面都在討論怎麼配電腦,配的都是10000左右的,一問,原來是開2台,一台和人網下,一台運算,如果對方也是如此的話……就得不停提升自己電腦的算力,我建議他們去租大型機,被群主踢了。


我覺得題主自己可以做這個實驗的。。。
自己在電腦上開兩個下棋的軟體,然後把一個下法下給另外一個,看看誰能贏

我以前玩過的一些下棋的遊戲,走法是固定的,我按照一樣的走法走過幾次,發現電腦的應對手段都是一樣的
也就是說這不是一個隨機事件,而是一個必然事件。相當於你的每一步都只是有限解里的一種解

所以我個人倒是很好奇,這倆如果先後手固定,是否會出現每一局都是完全一樣結果的情況
因為畢竟有一種演算法是計算最優解。假設你之前的走法都是一樣的,那每次計算出來的最優解走法也都是一樣,不會出現隨機另外答案的情況。而且一般的下棋AI,先手的走法也是固定的。。。因為其實走出的第一步,也是有最優解的。。。

=====
另外再補充個題外話,假設不計時間成本的話,其實這個主要和演算法有關。如果你捨得讓某台電腦一步棋算個幾十分鐘幾小時的話,其實電腦超級不超級問題都不大的

現在除了圍棋之外的大多數常規棋類並不需要很超級的電腦也是可以應對的


兩台聰明的電腦會不會借下棋的機會來交流某種信息商討怎麼推翻人類統治啊


@曉風殘月 和 @慧航討論了棋類遊戲作為finite game of perfect information的情況,這裡我補充一下infinite game of perfect information的情況。

很多人已經指出了Zermelo"s theorem,正好知道GEB有篇文章(http://www.labri.fr/perso/gimbert/enseignement/enseirb/zermelo.pdf)對Zermelo"s theorem以及其他人的工作的闡釋,理清了一些廣泛存在的誤解,甚至翻譯了Zermelo的原文。

這裡介紹一下在descriptive set theory里的相關內容,考慮一個game tree(H, prec,A,alpha)

  1. H由game tree上的所有node組成。存在一個root,varnothing in H,即任取h in H, varnothing preceq h
  2. alpha : H 	o {	ext{I, II}} 指派給所有node一個player。這個playeralpha(h)將在h從行動集合A(h)中選擇一個行動。
  3. H可由到達h的行動序列遞歸定義:varnothing in H(varnothing, a) in H for a in A(varnothing)ldots 如果h in H ,則(h, b) in H for b in A(h)。所以,如果存在n使得proj_{ A[H]^n}h_2 = h_1,則h_1 preceq h_2

Remark:我們的這個設定還是比較一般的:它不要求當一個player選擇完行動後,接下來的player一定是其他的player。它也對每條path的長度也沒有限制,可以在有限步內結束,也可以永遠的進行下去。

在這個game tree上所有的outcome構成的集合,記為lceil H 
ceil : = { h in H mid forall h^prime in H(h^prime succeq h implies h^prime = h)}

我們定義,在這個game tree的outcome set,lceil H 
ceil, basic open set(生成所有開集的開集)的形式為: lceil H_h 
ceil :={ h^{prime} in lceil H 
ceil mid h^{prime} succeq h} 對於某個自然數nh in A[H]^n cap H

所謂一個遊戲規則,對應於一個定義在lceil H 
ceil 的函數:

  1. 對於player I, u_{	ext{I}} : lceil H 
ceil  	o [0,1]
  2. 對於player II, u_{	ext{II}} = 1 -u_{	ext{I}}

Remark:並不是所有效用函數都保證maxmin value等於minmax value,(見以前我答過的Bernstein set的例子:設某個純策略博弈的納什均衡不存在,那麼相應的混合策略博弈的納什均衡會存在嗎? - 長澤雅美的回答)。也就是說,如果允許使用選擇公理的話,我們可以說存在一個遊戲規則使得沒有人可以獲勝。

Observation:我們已知的棋類遊戲都是在有限步驟內判定一方獲勝,或者因為雙方陷入無限重複某局面而被判定和棋。這對應的情況為u_{	ext{I}} [ lceil H 
ceil  ] = {0, 0.5, 1},並且它們的原項均為F_{sigma} 集合,也就是閉集合的可列並。

定理(Donald Martin):u_{	ext{I}} 為一個Borel measurable函數,則sup_{S_I} inf_{S_{II}} u_{	ext{I}} = inf_{S_{II}} sup_{S_I} u_{	ext{I}}

這個定理太過強大,我們其實只需要如下的定理:

定理(Philip Wolfe):當獲勝集為F_{sigma}集合時,則max_{S_I} min_{S_{II}} u_{	ext{I}} = min_{S_{II}} max_{S_I} u_{	ext{I}}

References:
[1]:Martin, Donald A. "Borel determinacy." Annals of Mathematics (1975): 363-371.
[2]:Mycielski, Jan. "Games with perfect information." Handbook of game theory with economic applications 1 (1992): 41-70.
[3]:Schwalbe, Ulrich, and Paul Walker. "Zermelo and the early history of game theory." Games and economic behavior 34.1 (2001): 123-137.
[4]:Wolfe, Philip. "The strict determinateness of certain infinite games." Pacific Journal of Mathematics 5.1 (1955)


就拿最簡單的井字棋來說。對於先手的玩家,是有不敗走法的。既然你已經說了是絕頂聰明的電腦,那麼優勢方一定會採取最佳進攻策略,防守方一定會採取最佳防守策略。那麼結果毫無疑問就是和棋。
如果一個遊戲有必勝法,結局肯定是符合必勝法的一方勝利。
此結論可以擴展到更加複雜的遊戲,反正對於絕頂聰明的電腦來說,都是簡單博弈。

除非你說的絕頂聰明指的是接近上帝的水平,那麼他們不會下棋。


如果有必勝策略,必勝策略對應的那方贏。否則和局。


作為程序猿,我就不能理解為啥要用兩台電腦?!

下棋這麼簡單的任務,電腦用兩個進程自己跟自己下就行了嘛!
至於結果?一秒鐘好幾盤,有輸有贏,自己去看日誌吧。

還能多開幾個進程預測一下天氣,模擬一下核爆、生化反應什麼的。

(腦補一下國防電腦操作員,在超級電腦上裝手柄玩小蜜蜂的場景)


為了這個問題 我特意讓我家的本本實驗了下 象棋 用的象棋大師軟體 雙系統雙開實驗了下 不知道是我電腦設置的問題還是什麼,win7都贏xp→_→ 覺得太丟臉 可恥的匿了……


絕對聰明的話,影響結局的因素只有一個:誰是先手?
對於一些遊戲,具有先手必勝的策略,這個時候確定電腦A先手的話,A按必勝策略走一步,電腦B認輸。
對於一些遊戲,具有先手必輸的情況時,這個時候確定電腦A先手的話,A直接認輸。
如果沒有絕對勝負的策略,這個遊戲可能是一個和局。


我想到一個絕妙的證明對中國象棋來說先手必勝,無奈這塊空白太小,寫不下。


這種程度的電腦根本就不會去玩這種已經沒有任何懸念的遊戲,就像兩個成人不會無聊到去下井字棋(Tic-Tac-Toe)一樣。


兩台絕頂聰明的電腦會商量一下說,我們還是先統治人類吧。


這題不答我渾身難受。但是請噴子們不要胡亂噴,我的答案是有依據的。只是我真的沒有心思和時間去一步步給出推導,只能簡單的寫一下證明過程,以及指出很多知友答錯的地方。
直接給出答案:

首先要看你的棋是什麼棋,其實什麼棋不重要,重要的是他是個先手必勝的遊戲,還是個先手必敗的遊戲,還是個必和的遊戲。然後經過一番戰鬥,最終證明這個結果(必勝、必敗還是必和)。

如果以中國象棋為例,哪怕下一萬盤棋,經過艱苦卓絕的戰鬥後,也必然有固定而一致的結果,只是還沒有最終結論,所以我們無法確定是先手電筒腦必勝,還是必和。但是絕對不會是黑勝。


1、就算是再絕頂聰明的電腦,只要是電腦,你讓他下象棋,他就一定會一步步的走下去,絕對不會一開場就認輸。
這一點無需證明。這一點不同意 @炸飛 同學的答案。
兩個成年人是不會玩井字棋,但是你讓兩台電腦玩井字棋,它們一定是玩得不亦樂乎,雖然盤盤都是和棋。同樣的道理,你開兩個電腦聯機下象棋(假設他有這個聯機功能)電腦是不會管對面是電腦還是一條狗的,他會按他的思考下到完;
除非是智能AI,也就是說完全通過圖靈測試、和人類一樣自主思考的機器人,他們直接拒絕比賽,風輕雲淡的告訴你結果,但那是另外一回事。這是屬於機器人直接拒絕比賽,離題了。

2、以中國象棋為例的話,最終的結果,因為還沒有定論,但是:只可能是先手必勝或者必和。
這裡要說明白:不存在勝或者和兩種可能性,而是如果有最終定論的話,要麼先手必勝,要麼就是先手必和。而且最終結論是先手必勝的可能性比較高。
這一點不同意 @曉風殘月 同學的答案。
不用跟我說什麼其它棋類有後手必勝的。我們只討論中國象棋。
如果能明白我這句話是什麼意思的,一定是象棋上有一定認識的人。如果理解不了,那就不用跟我爭辯了——「紅子比黑子天生多了一先的差距」
也就是說,紅黑兩色象棋擺好,兩台超級電腦擺好,他們完全遵照最佳策略下棋,完全計算所有的步子,從開局第一次動一直計算到將死,那麼,先走的一方有一個「一先」的優勢。後走的一方只有2個可能性:要麼無法抵抗這一先的優勢敗北,要麼抵消這個一先的優勢和棋。
如果這個一先的優勢它居然能抵消,而且反敗為勝,那麼只有一個可能:黑棋的AI比紅棋的AI優秀,這又不符合題意了。
A、學術性的說明:象棋是個什麼類型的博弈遊戲,知乎上有很多說明,自行搜索。
B、輔證說明:目前全國性象棋比賽,先手勝率比後手勝率高一倍,但是先手勝加後手勝的棋全部放在一起,跟和棋差不多一樣多。也就是下1000盤,那麼先手勝大概300盤,後手勝大概150盤。其它全部是和棋。所以在象棋比賽上,各種針對和棋的規則多如牛毛。大家自行搜索大型象棋賽事的結果即可。但是!這個和棋多,並不代表象棋的最終定論是和棋,而是因為大家都是人,計算太多會累。為了保證不輸,又不想思考到脫水,那自然會走一些故意拼和的路子,然後順理成章就和棋了。這種做法在中國象棋界非常常見,這就是所謂的「慫和!」
C、輔證說明:事實上,如果不討論貼目的話,圍棋也是個先手必勝的遊戲。這一點在知乎上已經有證明過程,大家自行翻閱。

3、其它
A、現在的象棋軟體已經發展到可以學習人類的下法,並非一成不變。這一點可以刷新 @司空摘星 同學的三觀。
B、事實上,高級象棋軟體所需要的計算機運行能力非常高,該計算能力絕非一個什麼遊戲機能勝任的。所以,不會出現一秒下幾盤的情況。因為計算機運算能力提高了的話,軟體也會隨著跟新出更高級的AI;這一點不同意 @振華 的說法。
C、接上條,中國象棋的計算量遠遠小於圍棋。事實上,現在最高級的中國象棋軟體已經完爆所有的頂級棋手。但是高級圍棋選手打敗AI還是可以的。或者說,計算機在計算圍棋的下法上還有漏洞,不能完全暴力模擬;


推薦閱讀:

哪些笑話只有程序員才能聽得懂?
《計算機網路》這門課為何如此之難?
你有哪些用計算機技能解決生活問題的經歷?
為什麼十年前512M內存的電腦用得飛快,而現在4G的還不夠用?
有哪些程序員特有的技能?

TAG:數學 | 計算機 | 邏輯 | 博弈論 |