「田忌賽馬」的戰略可以用博弈論解釋嗎?

本題已加入知乎圓桌 ? 日常經濟學 · 博弈人生,更多「博弈論」話題討論歡迎關注


「田忌賽馬」 這個故事本身不適合用博弈論。

因為齊威王的策略是給定不變的,只有田忌在決策。所以,我們用決策論來解決這個問題。事實上,田忌之所以能夠取得勝利,是因為他掌握了更多信息,同時齊威王保持自己的策略不變。

當然,我們可以把它擴展為一個博弈論問題,即讓齊威王和田忌兩人都可以自由選擇己方賽馬的出場順序,看看結果會如何不同。(齊威王很大可能會贏)

「敗走華容道」 這個故事可以用博弈論來解釋,因為諸葛亮和曹操都在作出決策,沒有誰是靜止不動的。最後,諸葛亮用自己的二階理性,打敗了曹操的一階理性。


這是我們《博弈論》課第一周的作業:

所以簡要回答一下作者的問題:

可以


齊威王的決策是明確的,因此,不需要用到博弈論。

如果齊的決策是不定的,即根本不知道是上中下,田忌的問題才是博弈論。


可以的。我本科的時候上對外經濟貿易大學國際經貿學院馬捷老師的產業組織理論第一課就是用extended form來formalize田忌賽馬這個故事,感興趣的可以找他要要課件


做一個次要的補充。

準確的說,田忌賽馬屬於決策論(Decision Theory)的範疇,而非博弈論(Game Theory)。

決策論:對一個給定的策略(齊威王的策略),找出其特點和邏輯並研究對應的最優策略(孫臏-田忌的策略)。

博弈論:研究個體如何在多個對手( ≥1 )多種策略的情形下取勝的學問。

如果齊威王賽馬的順序是非固定的(比如在王輸給忌之後的第二天),那麼就可以用博弈論來研究。並且這屬於非合作博弈論,才有納什均衡一說。

更多關於納什均衡請見 Superhistorical 的答案。


在田忌賽馬的故事裡,田忌用了一個簡單的策略輕易取勝,但這只是在齊威王沒有相應的策略意識,且事先讓田忌知道自己的出馬次序下的理想狀況,這種狀況確實構成不了一個博弈問題,只是一個對方把出牌順序都給自己看了後的如何出牌問題

博弈問題的最起碼特徵就是策略互相牽制對抗,都不知道對方實際會出什麼策略。

事實上,在真實的賽馬中,齊王即使吃了一次虧,在下次賽馬中也會意識到錯誤,會約定雙方事先都不能知道對方的出馬次序,而且也不會再固定一種出馬次序,和田忌處於了平等的策略對抗地位。這時的「田忌賽馬」才構成了一個博弈問題。這個問題屬於「二人零和博弈」,即雙方的收益總和為0,一方的得必等於另一方的失。而且還可歸為「完全信息靜態博弈」,因為博弈雙方同時決策,而且都了解對方在所有策略組合下的收益信息。

這時問題就是討論田忌和齊威王該如何選擇策略。根據「完全理性」和「完全信息」假設,田忌和齊威王都擁有同樣完美的分析判斷問題的能力,都完全掌握了對方在不同策略組合下的收益信息,那麼雙方都會盡量不讓對方知道自己的出馬次序,在單次賽馬中,上中下三種馬一共有 3!= 6 種出馬次序,任何一方都無法固定一種策略並確定對方也一定會採取某個策略,也就是說,這個博弈不存在一個雙方都沒有動機去改變的純策略組合,即沒有純納什均衡,所以在單次賽馬中,任何一方都不能保證自己會贏,只能由雙方隨機的出馬次序決定結果。

但這個博弈有混合策略納什均衡,即雙方都以均等的1/6概率選擇6種出馬次序 (http://www.doc88.com/p-20890260815.html )。多次重複博弈後,因為齊威王的馬總體更好,齊威王獲勝的次數更多。


弱 中 強(對手)

弱 0 0 0

中 1 0 0

強 1 1 0

@superhistorical 我之前這個表是錯誤的 詳細分析一下。

在博弈論中存在4種情況:

1、完全信息靜態博弈

2、完全信息動態博弈

3、不完全信息靜態博弈

4、不完全信息動態博弈

概念:靜與動指的是大家是否同時出招

完全與不完全指的是雙方是否都知道對方的收益函數。

對於田忌賽馬來講,這不是一個有意義的博弈過程。因為在這裡只要齊威王先出招,田忌必勝。田忌先出馬,在齊威王知道自己的收益函數的情況下(即知道田忌的中馬能勝過自己的下馬),齊威王必勝。

甚至這壓根不是一個動態博弈過程。因為第二輪的賽馬情況完全不會影響到第一輪的賽馬情況。

這也不涉及混合策略。混合策略是指,博弈存在多個納什均衡的情況,參與者會隨機選擇一種納什均衡來行動。這個在序貫博弈中不存在。完全信息動態博弈是靠逆推法。(可以參考海盜問題)如果想說,不完全信息動態博弈的話,也很牽強,因為田忌 不會有概率實行其他行動。即齊威王出上,田忌必出下。田忌出上,齊威王必出上,就一個策略。先出招者必輸。

這個問題有意思是假如這變成了一個靜態博弈過程會是什麼樣,即雙方都不知道對方會派什麼馬,這樣應該如何博弈。

那麼在雙方都沒有對先出某匹馬有特別的偏好的情況下:

第一輪:

假設齊威王出上,田忌出下,那麼齊威王之後還有中、下兩匹,田忌還有中、上兩匹,假設雙方的收益函數是共同知識。那麼,齊威王之後獲勝的概率有1/2,(即第二輪是齊 中,田中,或者是齊 下,田 上),田忌獲勝的概率是1/2。

假設齊威王出上,田忌出中,那麼齊威王之後還有中、下兩匹,田忌還有上、下兩匹。那麼齊威王獲勝的概率是1

假設齊威王出上,田忌出上,那麼齊威王之後還有中、下兩匹,田忌還有中、下兩匹。那麼齊威王獲勝的概率是1

假設齊威王出中,田忌出上,那麼齊威王之後還有上、下兩匹,田忌還有中、下兩匹。那麼齊威王獲勝的概率是1/2(即第二輪是齊 上,田 中,或者是齊 下,田 下)

假設齊威王出中,田忌出中,可以算得齊威王獲勝概率是1

假設齊威王出中,田忌出下,可以算得齊威王獲勝概率是1

假設齊威王出下,田忌出上,可以算得齊威王獲勝概率是1

假設齊威王出下,田忌出中,可以算得齊威王獲勝概率是1/2

假設齊威王出下,田忌出下,可以算得齊威王獲勝概率是1/2

第一輪收益表格如下:

上 中 下

田 上 (0,1) (1/2,1/2) (0,1)

中 (0,1) (0,1) (1/2,1/2)

下 (1/2,1/2) (0,1) (0,1)

可見,這裡是不存在納什均衡的,也不涉及混合策略。對於田忌,和齊威王都是只能隨機猜一個。第二輪同樣的,也是不存在納什均衡的,也是大家猜一個。

但是我們可以算出田忌獲勝的概率:

第一輪成功是1/3,第二輪成功是1/2。

即田忌在兩輪靜態博弈中都成功(注意不是獲勝)的概率是1/6。

對於當時來講,就應該保證信息的嚴密,不讓田忌知道自己每次都是出的哪匹馬,這樣齊威王就有相當大的概率能獲勝了。所以來講,田忌賽馬其實是信息戰啊 :D


田忌賽馬 的解釋不需要現代意義的博弈論,另外一些理論並非越現代越有用,熟悉現代博弈論的經濟學家不一定能在實際問題如商業競爭中勝過熟悉孫子兵法的銷售人員。

以當時歷史背景看,田忌賽馬的對策無非是傳統兵法或道家思想的簡單應用,提幾個可參考

知己知彼 百戰百勝 知己不知彼一勝一負

欲取先予 曲則全

博弈論,經濟學都有諸如理性人的假設,所以終究是理論研究為主,實際問題尤其人性相關的解釋理解可以多讀點傳統文化的經典著作或許更有用。


這個場景可以用博弈論來考慮。

齊王的一階信念(對田忌策略的預測)是錯誤的

但是田忌擁有正確的一階信念和正確的二階信念(對齊王猜測的猜測)

雙方根據自己的信念作出最優選擇。

但是這不被考慮為一個均衡,因為齊王的猜測錯了。


齊威王的決策已給出,不需要博弈論。


同意決策輪說法,但從博弈論講,田忌玩的是動態博弈,他看著齊威王先出馬再出對策,也可以說是抓住了比賽的一個漏洞,利用了這個漏洞。而齊威王是沒有想倒自己的粗心改變啦博弈的性質。


我覺得不可以。

博弈論的前提是,博弈雙方都理性(rational,以追求自身利益最大化為目的)並且活躍(active,為了實現目的而不斷做出選擇)。

田忌賽馬的故事中,齊王是個死腦筋,他根本沒有考慮田忌改變策略的可能性,而是固執地遵循「上馬對上馬,中馬對中馬,下馬對下馬」的規則。也就是說,不論田忌安排做出怎樣的選擇,齊王都不會改變自己「上-中-下」的策略。而田忌需要做的,只是根據齊王給出的選擇尋找最優對策而已。這不是雙方的博弈,而是田忌單方面的決策。

所以「田忌賽馬」說白了就是:齊王給田忌出了道題,田忌找到了答案。這應該屬於決策論,不是博弈論。


只考慮整場比賽輸贏的話,一個簡單的靜態博弈,混合策略納什均衡是平均分。


博弈論要求博弈雙方都是及其聰明的,但是這齊王明顯是傻逼一枚,所以博弈論搞不定。


沒有真正意義上學過什麼博弈論,只看過一兩節耶魯的公開課。我認為博弈論所面對的情形是不穩定的動態過程,每個決策方都可能臨時做出變動的決策,這正是博弈論的研究範疇,也是其迷人之處。

既然決策是多方的,因此肯定有個先後順序,先做出決策的人影響了後做決策方的決策環境,也就是說,誰先作出明確的決策,誰就為後做決策的人提供了一個或多個考慮因素,作為後者的決策參考;因此,如果決策局中的雙方或者多方是競爭或敵對關係,而且先做決策的人一旦做出決策就不能更改,肯定是後做決策的人佔便宜,因為一種不確定因素被「消滅」了。

所以,在田忌賽馬的故事中,齊威王的賽馬出場順序已定,其實勝負就分出來了。

我並不在乎博弈論中是否有什麼理論能解釋田忌賽馬的故事,因為這個故事,在我們的小學時代就已經被挖掘的差不多了,其精髓無非在於:

  • 用自己最小的力量消耗掉敵人最強大的力量,類似武學中的四兩撥千斤;
  • 優化自己的力量組合順序,使其發揮最大效用;
  • 緊緊抓住制勝的關鍵,不做無謂的鬥爭無意義的犧牲。

因此,我個人認為,用博弈理論解釋田忌賽馬的故事,思路固然好,有助於更深層次理解博弈論的精妙,但對實際決策卻沒有什麼指導意義。

不如我們做個假設:我們假設齊威王很狡詐,他告訴田忌按上中下等馬的順序出場比賽,但實際上以另一種順序出場,而田忌又沒有察覺出來,怎樣的順序才能讓齊威王勝過田忌呢?田忌會做出什麼樣的順序排列來確保自己不敗?

《孫子兵法》講:兵不厭詐。當今的商場上不也是這樣嗎?大家都在喊:要講誠信,詐,算不算不誠信?這涉及到太多領域的問題了,大家只關注加粗的部分就OK!謝謝!


比較優勢


推薦閱讀:

列數男女在思維上的差異?
怎樣將碎片化的知識進行有效的梳理?
文科生和理科生的區別在哪裡 文科生真的不如理科生嗎?
人怎樣才能學會深度思考?
為什麼有的人從不讀書但其遠見、思維方式、做事方法卻那麼卓越?

TAG:思想 | 博弈論 | 思維方式 |