這才是真正的博弈論:再論華容道
我曾經寫過一篇以華容道為材料講解博弈論的文章,可能是因為我的敘述太簡單,以至於好多人沒有看懂,我決定重新論述一次。
赤壁之戰曹操被東吳一把火燒了戰船,倉皇逃竄,擺在他面前的逃生之路有兩條,一條是平坦大道,一條是崎嶇小路。諸葛亮在大道上虛插旗幟,卻讓軍隊在小路攔截曹操。曹操看到大道上有敵軍旗幟,就選擇了小路,因小路險惡,人馬自相踐踏,死傷無數,本以為勉強能逃出升天,不料還是掉入羅網,幸好關羽義薄雲天,才僥倖大難不死。這就是著名的華容道。
我們就來分析一下,曹操和諸葛亮分別選擇的策略是不是優選策略。
在華容道這一局博弈中,曹操的目標是將更多的兵力帶回老巢,諸葛亮的目標是儘可能多的消滅曹操的兵力(雖然諸葛亮可能並不想消滅曹操的兵力,但是曹操認為諸葛亮一定要消滅他。無論諸葛亮是不是打算放走曹操,他既然派人去攔截,就一定是要設法遇到曹操)。最終,曹操剩下的兵力,為其收益;曹操損失的兵力,為諸葛亮的收益。
我們假設,曹操共有2單位兵力,走小路,因為地勢崎嶇,有1單位的非戰鬥損失;若遇上敵軍阻截,發生戰鬥,再損失1個單位。諸葛亮只有能力守住其中一條道路。
曹操的策略有兩個,走大路和走小路;諸葛亮的策略同樣有兩個,守大路和守小路。
曹操選擇走大路時,諸葛亮守大路,曹操收益1,諸葛亮收益1
曹操選擇走大路時,諸葛亮守小路,曹操收益2,諸葛亮收益0
曹操選擇走小路時,諸葛亮守大路,曹操收益1,諸葛亮收益1
曹操選擇走小路時,諸葛亮守小路,曹操收益0,諸葛亮收益2
曹操大路 | 曹操小路 | |
諸葛大路 | 1,1 | 1,1 |
諸葛小路 | 0,2 | 2,0 |
(前方數字為諸葛收益,後方數字為曹操收益)
從以上收益矩陣能夠看出,諸葛亮在這一局博弈中,並沒有優選策略可供選擇。諸葛亮守大路,曹操選擇任何策略,諸葛亮的收益一樣;諸葛亮守小路,他的收益高低取決於曹操選擇哪個策略(曹操大路,他收益0,曹操小路,他收益2)。但是,無論諸葛亮選擇什麼策略,曹操走大路的收益,都不低於走小路。諸葛亮守大路,曹操選擇任何策略,收益都是1,1=1;諸葛亮守小路,曹操走大路收益2,走小路收益0,2>0。所以曹操選擇走大路,才是嚴格的優選策略,所謂嚴格的優選策略,即無論對手怎麼選擇,我選擇這個策略的收益,都不低於選擇其他策略。存在嚴格的優選策略時,選擇其他任何策略都不會獲得最好的結果。所以,曹操放棄了嚴格的優選策略,是選錯了,就算諸葛亮真的大路守著,他都要義無反顧地衝過去,何況僅僅是見到了一些旗子。
本來,諸葛亮是沒有優選策略可用的,他可以隨便選。由於曹操存在嚴格的優選策略,就是走大路,所以諸葛亮守在大路上,是與曹操相遇概率最大的策略,就是諸葛亮的優選策略。所以,諸葛亮也放棄了優選策略。雖然諸葛亮還是遇到了曹操,而且取得了雙方策略矩陣中,對他來說最好的結果(即諸葛亮收益2,曹操收益0)。這是建立在曹操做出了錯誤選擇的基礎上。
任何人選擇策略前,只能假設對方一定會選擇最好的、最對的策略,而不能假設對方一定不會選擇最好的、最對的策略,我方根據對方最好的、最對的策略,確定自己的策略。如果總是認為對方選不對,那不好的策略多了去了,你又怎知對方選擇哪一個呢?我方又該如何做出決策呢?
曹操就地自裁也算一個策略,諸葛亮怎麼不考慮呢?當然因為就地自裁對曹操來說是嚴格的劣選策略,他不會選的。曹操的優選策略,無非就是從大路逃跑還是從小路逃跑,諸葛亮要考慮的是,這兩個策略,對曹操來說,哪一個更好。諸葛亮守在小路上,要是曹操真的從大路跑了,諸葛亮的收益不就成0了么。
憑什麼諸葛亮認為以曹操的多疑,他一定會走小路呢?就憑你豎的那幾桿破旗?你怎麼知道曹操不會因為多疑而想:諸葛亮知道我的性格,他故意豎著些破旗迷惑我,逼我走小路,我偏不!然後劉備問諸葛亮為什麼守小路上不守大路,諸葛亮回答:因為曹操生性多疑……哪個員工敢這麼回答老闆的問題?若是諸葛亮守在大路,而曹操走了小路,劉備問諸葛亮為什麼不守小路時,諸葛亮回答:因為走大路是曹操最好的選擇,所以我守在大路上;即使曹操從小路逃跑了,我們依然獲得了1個單位的收益。各位可以比較一下兩者的回答,究竟哪一個更像一位運籌帷幄的智者。
諸葛亮在這一局博弈中,雖然得到了最好的收益,也只不過因為運氣好罷了。運氣,能作為我們決策的依據么?要是有人把完成目標可能性完全押寶在運氣上,我估計這人幾乎不可能完成任何目標。
當然,這個收益矩陣並不是一點問題沒有。比如說,小路的地形可能並不如我想像中的惡劣;大路的狀況也不如我想像中的這樣安全;曹操部隊可能失敗以後及其不願戰鬥,遭遇敵人的損失比我想像中要嚴重,等等。這些因素都是可以影響收益,從而左右曹操的策略的。如果這其中有某一個因素是十分確定的,比如現在十分確定,小路的惡劣情況只是我們想像中情況的70%,那我們就把曹操走小路的收益提高30%,諸葛亮的收益降低30%。收益矩陣就變成下面這個樣子。
曹操大路 | 曹操小路 | |
諸葛大路 | 1,1 | 0.7,1.3 |
諸葛小路 | 0,2 | 1.7,0.3 |
(前方數字為諸葛收益,後方數字為曹操收益)
這樣看來,曹操也不存在嚴格的優選策略,走哪邊都可以,諸葛亮守哪邊也都可以,遇不遇得到,真的得看運氣了。
問題在於,我們無法十分確定某件事,曹操和諸葛亮也不能!他們不能知道走小路的損失具體是多少,發生戰鬥的損失具體又是多少。
有時,走崎嶇地形會遇到很多狀況,導致非戰鬥損失大於戰鬥損失;有時,戰鬥中會遇到很多狀況,導致戰鬥損失大於非戰鬥損失。這兩種損失,是無法確定究竟誰高誰低的,只能認為一樣。有人認為,影響戰爭的因素很多,都會影響收益。但是這些因素,有可能是對諸葛亮有利,也有可能對曹操有利,不僅我們不知道,就連曹操和諸葛亮本人,也無法確切得知。所以,我們在收益矩陣中將非戰鬥損失和戰鬥損失都定為1,是合理的估計。
既然都是估計,那為什麼要建模呢?大多數情況下,我們確定收益,都是在估計,我們沒有能力算出精確的收益和虧損。我們選擇的策略,也都建立在估計來的收益的基礎上。既然都是估計,建立模型好歹算是一種分析方法,怎麼也比毫無方法的空想精確(如果誰有更精確的方法,請告訴我)。
在華容道這一局博弈中,曹操因為一敗塗地,倉皇逃命,無暇細思,忙中出錯,放棄了嚴格的優選策略,還情有可原;諸葛亮時間寬裕,準備充分,卻依舊大失水準,只能讓人嘆息了。
第五大洋:歷史百家爭鳴特約作者。 1987生於中國青島,畢業於青島大學漢語言文學專業,取得文學學士學位。現任天津某事業單位助理工程師。業餘歷史愛好者,信奉美國聯邦大法官理查德·A波斯納為首的法律經濟學流派,熱衷於使用現代經濟學分析方法分析歷史事件。座右銘:存在不一定合理,存在一定有原因。
推薦閱讀:
※做事情要有有目的
※博弈論與納什平衡
※我們是誰 | Who Are We
※直播平台與遊戲廠商的博弈史:相愛相殺後將走向何方?
※達到目標的方法-博弈論納什均衡
TAG:博弈論 |