博弈論入門

07-01

博弈論入門

[日期：2005-09-17]

來源：教科研室作者：

[字體：大中小]

博弈論入門

南京市第十三中學面向全國長期誠聘優秀教師

基礎知識

博弈論是一種獨特的處於各學科之間的研究人類行為的方法。與博弈論有關的學科包括數學、經濟學以及其他社會科學和行為科學。博弈論（如同計算科學理論和許多其他的貢獻一樣）是由約翰·馮·諾伊曼（Johnvon Neumann）創立的。博弈論領域第一本重要著作是諾伊曼與另一個偉大的數理經濟學家奧斯卡·摩根斯坦（OskarMorgenstern）共同寫成的《博弈論與經濟行為》（The Theory of Games and Economic Behavior）。當然，摩根斯坦把新古典經濟學的思想帶入了合作中，但是諾伊曼也同樣意識到那些思想並對新古典經濟學做出了其他的貢獻。

一個科學的隱喻

由於諾伊曼的工作，在更廣闊的人類行為互動的範圍內，「博弈」成為了一個科學的隱喻。在人類的互動行為中，結局依賴於兩個或更多的人們所採取的互動式的戰略，這些人們具有相反的動機或者最好的組合動機（mixed motives）。在博弈論中常常討論的問題包括：

（1）當結局依賴於其他人所選擇的戰略以及信息是完全的時候，「理性地」選擇戰略意味著什麼？

（2）在允許共同得益或者共同損失的「博弈」中，尋求合作以實現共同得益（或避免共同損失）是否「理性」？或者，採取侵略性的行動以尋求私人利益而不顧共同得益或共同損失，這是否是「理性」的？

（3）如果對（2）的回答是「有時候是」，那麼在什麼樣的環境下侵略是理性的，在什麼樣的情況下合作是理性的？

（4）在特定情況下，正在持續的關係與單方退出這種關係是不同的嗎？

（5）在理性的自我主義者的行為互動中，合作的道德規則可以自然而然地出現嗎？

（6）在這些情況下，真正的人類行為與「理性」行為是否相符？

（7）如果不符，在哪些方面不符？相對於「理性」，人們更傾向於合作？或者更傾向於侵略？抑或二者皆是？

因而，博弈論研究的「博弈」包括：

§破產

§門口的野蠻人（Barbarians at the Gate）

§網路戰（Battle of the Networks）

§貨物出門，概不退換（Caveat Emptor）

§徵召（Conscription）

§協調（Coordination）

§逃避（Escape and Evasion）

§青蛙呼叫配偶（Frogs Call for Mates）

§鷹鴿博弈（Hawk versus Dove）

§Mutually Assured Destruction

§多數決定原則（Majority Rule）

§Market Niche

§共同防衛（Mutual Defense）

§囚徒困境（Prisoner"s Dilemma）

§補貼小商業Subsidized Small Business

§公共地悲劇Tragedy of the Commons

§最後通牒Ultimatum

§視頻系統協調Video System Coordination

（以上列表摘取自Roy Gardner在《商業與經濟學博弈》探討過的一個博弈的索引）

理性

1、新古典經濟學與博弈論之間的關鍵鏈接就是理性。新古典經濟學建基於這樣一個假設之上，即人類在其經濟選擇行為中是絕對理性的。確切地說，這個假設意味著每個人在其所面臨的環境中都會最大化自身的報酬——利潤、收入或主觀利益。在資源配置研究中，上述假說服務於兩個目的：一是稍稍縮小可能發生事物的範圍；二是提供了一個衡量經濟體制效率的標準。如果經濟體制導致部分人的報酬減少，而又沒有對其他人產生更多的報償（寬泛地講就是成本大於收益），那麼在某些方面就產生了失誤。污染、漁業資源的過度開發、不恰當的資源用於研究（inadequate resources committed to research）都是這類問題的例子。

在新古典經濟學中，理性的個人面臨特定的體制或制度，包括產權、貨幣和高度競爭的市場。這些是個人納入最大化報酬計算的許多「情況」之一。財產權利、貨幣經濟以及理想化的競爭市場的隱含意義是經濟個體不需要考慮自己與其他經濟個體的行為互動。他或她只需要考慮自己的境況和「市場條件」。但這導致了兩個問題：一是理論的範圍受到局限。只要競爭受到限制（但沒有壟斷）或者產權沒有完全界定，眾望所歸的新古典經濟學理論就不適用了，並且新古典經濟學也從未產生可接受的理論擴展以覆蓋上述情況。對於新古典經學來說，決策是在貨幣經濟之外做出的，這也是有問題的。

博弈論正好面對上述問題：提供一個關於人們直接（而不是「通過市場」）互動的經濟和戰略行為的理論。在博弈論中，「博弈」始終是針對人類社會嚴肅的互動行為的一個隱喻。博弈論也許是關於紙牌遊戲或者棒球運動的理論，但卻不是關於象棋的理論，它是關於這樣一些嚴肅的互動行為比如市場競爭、軍備競賽和環境污染的理論。只不過博弈論涉及這些問題的時候使用的是博弈的隱喻意義：在這些嚴肅的互動行為中，就像在遊戲中一樣，個體的選擇實質上是戰略選擇，行為互動的結局依賴於每個參與人所選擇的戰略。通過這樣的闡釋，研究「博弈」可以真正告訴我們關於嚴肅的互動行為的一些事情。但是，究竟會告訴我們多少？

在新古典經濟學理論中，理性地進行選擇就是要最大化自身的收益。在某種觀點看來，這是一個數學問題：在給定環境條件下選擇最大化報酬的行動。因而我們可以把理性的經濟選擇當作一個數學問題的「解」。在博弈論中，情況就更複雜了。既然結局不僅依賴於自身的戰略和「市場」條件，也直接依賴於其他人所選擇的戰略，但我們仍然可以把理性的戰略選擇當作一個數學問題——最大化行為互動中的決策制定者群體的報酬——從而我們再次稱理性的結果是博弈的「解」。

2、囚徒的困境

博弈論近來的發展，特別是1994年諾貝爾紀念獎授予給三位博弈論理論家以及89歲高齡的塔克（A. W.Tucker）在1995年1月的去世，喚起了人們對博弈論創立時的回憶。儘管博弈論可以追溯到更早的時代，但其興起的關鍵時期是20世紀40年代。當然，《博弈論與經濟行為》的出版是一個特別重要的台階。但是，在某種程度上，塔克發明的「囚徒困境」例子更為重要。這個可以在一頁紙上求解出來的例子在20世紀下半葉的社會科學中可能是最具影響的一頁。

這個傑出的創見並不是出自研究論文，而出自於課堂。正如S.J. Hagenmayer在《費城調查者（Philadelphia Inquirer）》("Albert W. Tucker, 89,Famed Mathematician," Thursday, Feb. 2, 1995, p..B7)中寫到：「在1950年，作為訪問教授，塔克在斯坦福大學向由心理學家組成的聽眾發表演說的時候，創造了『囚徒困境』來說明分析某些類型博弈的困難。塔克的簡單解釋導致了後來大量的文獻。這些文獻來自不同的領域，比如哲學、倫理學、生物學、社會學、政治科學、經濟學，當然還有博弈論。」

囚徒困境博弈

塔克是從這樣一個小故事開始的：兩個夜賊，鮑伯(Bob)和艾爾(Al)，在行竊現場附近被抓獲並被警方隔離拷問。每個夜賊都必須選擇是否坦白和揭發對方。如果兩個賊都不坦白，他們都將被判刑一年。如果每個賊都坦白並揭發對方，他們都將在監獄中度過10年。但是，如果一個賊坦白並揭發對方，而另一個賊不坦白，那麼與警方合作的賊將被釋放而另一個賊將在監獄中度過20年。

在這個例子中的戰略是：坦白與不坦白。贏利（payoff）（實際上是處罰）是判刑。我們可以用「贏利表（payoff table）」簡潔地表達上述信息，這類贏利表已經成為博弈論中很好的標準表達式。以下是囚徒困境博弈的贏利表。

表2-1

		艾爾
=		坦白	不坦白
鮑伯	坦白	10，10	0，20
鮑伯	不坦白	20，0	1，1

這個表的讀法是這樣的：每個囚犯從兩個戰略中選擇一個。即，艾爾選擇一列，鮑伯選擇一行。每個單元格的兩個數字告訴兩個囚犯相應的戰略被選擇後的結果。逗號左邊的數字表示選擇行的人（鮑伯）的贏利，逗號右邊的數字表示選擇列的人（艾爾）的贏利。因此（先閱讀第一列），如果他們都選擇坦白，每人將判刑10年，但是如果艾爾坦白而鮑伯不坦白，鮑伯被判20年而艾爾將被釋放。

那麼：怎樣求解這個博弈？如果雙方都想使自己呆在監獄的時間最短，他們選擇什麼戰略是「理性的」？艾爾可能會做這樣的推理：「兩種事件可能發生：鮑伯要麼坦白要麼保持沉默。假定鮑伯坦白，我不坦白的話將被判20年，我也坦白的話則判10年。另一方面，如果鮑伯不坦白，我不坦白我被判刑1年，但在這種情況下，如果我坦白我可以被釋放。無論怎樣，我選擇坦白都是最好的。因此，我將坦白。」

但是鮑伯能夠而且大概也將做同樣的推理——因此他們都將坦白並且都在監獄呆10年。然而，如果他們「不理性」地行動，都保持沉默，他們都可以在1年後被釋放。

佔優戰略（Dominant Strategies）

這裡發生的情況是，兩個囚犯陷入了「佔優戰略均衡」。

定義：佔優戰略——讓博弈的參與人單獨地評估他面臨的戰略組合中的每一個戰略，並且，對於每一個組合，他從自己的所有戰略中選擇一個使他贏利最多的戰略。如果對於參與人面臨的每一個不同的戰略組合，參與人都選擇同一個戰略，這個被選擇的戰略就叫該參與人在博弈中的「佔優戰略」。

定義：佔優戰略均衡——在一個博弈中，如果每個參與人都有一個佔優戰略，且每個參與人都採取佔優戰略，那麼（佔優）戰略組合及其相應的贏利被認為是構成了博弈的佔優戰略均衡。

在囚犯困境博弈中，坦白是佔優戰略，當兩個囚犯都選擇坦白時，那就是佔優戰略均衡。

囚犯困境中需要考慮的問題

這個不同尋常的結果——兩個囚犯出於自利的個體理性行動導致雙方情況變得更糟糕——在現代社會科學中產生了廣泛的影響。因為在現代世界裡有大量的行為互動與此極其相似，從軍備競賽到道路擁擠，以及漁業資源貧化污染和地下水資源的過度開發等，莫不如此。這些行為互動在細節上有很大差異，但卻如我們想像的一樣，個體理性給每個人帶來了更差的結果，囚犯困境暗示了它們的發展方向。這就是「囚犯困境」的威力所在。

當然，我們也必須坦白地承認，囚犯困境對於上述行為互動來說是只一個非常簡明扼要的概括——如果你願意，也可說它「不切實際」。囚犯困境也孕育了許多對其進行批評的論點，這些論點構成了許多學術文獻的基礎：

n 囚犯困境是二人博弈，但是這一思想的許多應用場合是真正的多人行為互動。

n 我們假定兩個囚犯之間沒有進行過溝通。如果他們能夠相互溝通並謀求協調戰略，我們有可能得到不同的結局。

n 在囚犯困境中，兩個囚犯僅博弈一次。重複的博弈行為可以導致大相徑庭的結果。

n 導致佔優戰略均衡的推理也許是強制進行的，但它並不是推導出問題的唯一方式。也許它根本就不是最理性的答案。

我們將在以後討論其中的某些問題。

3、一個信息技術的例子

博弈論提供了一個很有發展前途的方法去理解各類戰略問題，囚犯困境及其他類似例子的簡明和威力使它們有了一個自然而然的起點。但是在更為複雜和現實的應用中，常常有一些我們必須考慮的衝突。怎樣從一個簡化的博弈轉移到更現實的博弈模型？現在讓我們來看一個真實世界的戰略思考的例子：選擇信息系統。

這個例子中，參與人是：一個正在考慮選擇新的內部電郵系統（internale-mail system）或內部互聯網系統（intranetsystem）的公司，以及一個正在考慮製造它們的供應商。兩個選擇是：建立技術先進的系統，或者建立一個功能簡單的一般系統。我們假定更先進的系統真的能夠提供更多的功能，因此兩個參與人的贏利，用戶支付給供應商的凈額如表3-1所示。

表3-1

		用戶
		先進	一般
供應商	先進	20，20	0，0
供應商	一般	0，0	5，5

我們發現，如果建立先進系統，兩個參與者的凈收入都將更好。（我們不是宣稱現實永遠如此！我們僅僅是假設在這個特定的決策下是如此）。可能發生的最糟糕的情況是一個參與者確定先進系統而另一個參與者卻堅持一般系統。在這樣的情況下將沒有交易，大家也就沒有贏利。為了在一起工作，供應商和用戶必須具有一個相容的標準，既然標準的選擇即戰略選擇，那麼他們的戰略必須相互吻合。

儘管第一眼看上去這很象囚犯困境博弈，但它實際上是更複雜的博弈。我們將逐一探討幾個複雜的方面：

n仔細看一看，我們發現這個博弈沒有佔優戰略。每個參與人的最優戰略依賴於對方所採取的戰略。因而，我們需要一個新的可以容納這種複雜性的博弈均衡概念。當沒有佔優戰略時，我們通常用一個叫做「納什均衡」（NashEquilibrium）的概念來稱呼均衡。納什均衡是根據諾貝爾獎得主納什來命名得。納什均衡是一個非常美妙簡單的思想：給定其他參與人所選擇的戰略，每個參與人都選擇最優戰略，我們將得到納什均衡。例如，如果用戶選擇先進系統，那麼供應商最好也選擇先進系統。於是（先進，先進）就是一個納什均衡。但是，請留意，如果用戶選擇一般系統，那麼供應商最好也選擇一般系統。這裡存在兩個納什均衡！究竟哪一個會被選擇呢？看起來選擇先進系統是更好的，因此它可能更容易出現，但是如果每個參與人都認為對方陷在一般系統——恰如陷入泥土中的手杖之一段——那麼雙方選擇一般系統將是最好的。假定對方是一根陷入泥土的手杖，雙方都會正確選擇的。這是一類非常危險的經典博弈，叫做「協調博弈」（coordinationgame）。我們已經學習到的是，相容標準選擇是協調博弈。

n我們假定贏利是確定而且大家都知道的。在現實世界，每一個戰略決策都有風險——針對先進系統的決策可能比針對一般系統的決策具有更大的風險。因而，要使例子完全現實化，我們還需要考慮參與人對風險的主觀態度，考慮他們的「風險規避」（riskadversion）。在這個例子中我們不做這樣的嘗試，但是我們必須把這些記在腦海里。

n在例子中我們假定贏利是以貨幣計量的。因而，我們不僅不考慮風險規避，而且沒有考慮無法用貨幣來計量的主觀收益或損失。經濟學家有辦法用貨幣項目來測度主觀收益——有時候他們確實這樣做——不過，我們將跨過這個問題並假定所有的報酬或懲罰都已經貨幣計量化，並且在用戶與供應商之間可以進行轉移，反之亦然。

n現實中，信息系統的選擇可能包括兩個以上的參與人，至少在長期是如此——用戶可能在幾個供應商之間選擇，而供應商也可以有很多客戶。這使得協調問題更難以解決。例如，假設「beta」是先進系統而「VHS」是一般系統，假設90%的市場使用「VHS」。那麼儘管「beta」是更好的系統，但仍將被「VHS」接管。許多經濟學家，博弈理論家和其他人相信，這是某種技術標準獲得支配地位的原因。（Macintosh機正在譜寫這樣的篇章。你是否能想到其他的象beta與VHS的例子？）

n另外，例子中用戶和供應商不能坐下來等待並觀察對方採取什麼行動——他們可以坐下來商量，並達成協議。事實上，他們的確這樣做，因為用戶支付給供應商的金額——在此之前我們忽略了這個戰略決策——也必須達成協議。換句話說，與囚犯困境不同，這是一個合作博弈（cooperativegames）,而不是非合作博弈（noncoorperativegame）。在一方面，這將使協調標準的問題變得容易，至少在短期如此；在另一面，合作博弈需要不同的方法去求解。

4、零和博弈

從塔克發明「囚犯困境」開始，博弈論業已受到廣泛關注。但是絕大多數早期的工作主要聚焦在一種特殊的博弈上：零和博弈（Zero-sum Gmes）。

在早期的工作中，諾伊曼做出了一個驚人的發現。他發現，如果玩紙牌的人最大化其報酬，他們採取欺騙來達到目的。並且，更一般地，在很多博弈中支付是不可預知的。當然，這在本質上並無新意——棒球投擲手早在諾伊曼寫出混合戰略前就知道投擲角度變換的球了。但是諾伊曼發現的更多。他發現了一個明確而又獨特的問題：在這類沒有市場、價格、產權和其他制度的博弈中，我如何最大化自己的收益？這個問題是對新古典經濟學絕對理性概念的一個主要擴展。不過諾伊曼為他的發現付出了代價。代價就是極端簡化的假定：諾伊曼的發現僅能用於零和博弈。

例如，考慮一個叫「賭便士」（matchingpennies）的小孩遊戲。在這個博弈中，兩個參與人同意一個是「Even(偶數)」一個是「Odd（奇數）」。每個人同時出示一個便士，每個參與人可以展示便士的正面或反面。如果兩人展示出同一面，Even將贏得Odd的便士，反之如果他們展示出不同的幣面，則Odd將贏得Even的硬幣。下面是該博弈的贏利表（表4-1）。

表4-1

		Odd
		正面	反面
Even	正面	1，-1	-1，1
Even	反面	-1，1	1，-1

如果我們加總每單元格的贏利，我們會得到1-1=0。這就是「零和博弈」。

定義：零和博弈——如果我們加總博弈的贏得和虧損，把虧損記為負數，我們發現每一個選定戰略的組合之支付加總之和為0，這個博弈就是「零和博弈」。

用非正式的語言講，一個零和博弈即一方所得為另一方所失的博弈。注意定義中要求每個戰略組合的支付總和為0。如果有一個戰略組合的支付加總不為0，這個博弈就不是零和博弈。

另一個例子

這裡有另外一個零和博弈的例子。它是一個非常簡單的價格競爭模型。象奧古斯汀?古諾（Augustin Cournot，1840）那樣，我們考慮兩個賣礦泉水的公司。每個公司在每一時期有$5000的固定成本，不管他們是否銷售。我們隨機地稱這兩個公司為畢雷礦泉水和阿波里羅礦泉飲料。這兩個公司在同一個市場競爭，並且每個企業必須選擇高價格（每瓶$2）或者低價格（每瓶$1）。以下是博弈規則：

（1）在$2的價格上，可以出售5000瓶獲得總收益$10000。

（2）在$1的價格上，可以出售10000瓶獲得總收益$10000。

（3）如果兩個公司選擇同樣的價格，它們平分銷售額。

（4）如果一個公司選擇更高的價格，那麼價格較低的公司得到全部的銷售量而價格高的公司一瓶也售不出去。

（5）贏利即利潤——收益減去$5000的固定成本。

以下是兩個公司的贏利表（表4-2）。

表4-2

		畢雷礦泉水
		$1	$2
阿波里羅	$1	0，0	5000，-5000
阿波里羅	$2	-5000，5000	0，0

（自己檢查一下，這是一個零和博弈）。對於二人零和博弈，存在一個清楚的解的概念。博弈的解就是最大化準則——即，每個參與人選擇最大化其最小贏利的戰略。在這個博弈中，阿波里羅在價格$1下的最小贏利為0，在價格$2下最小贏利為-5000，因此$1最大化其最小贏利。同樣的推理適用於畢雷礦泉水，因此它們都將選擇$1的價格。以下是最大化解背後的推理：阿波里羅知道任何情況下它所會失去的就是畢雷所得到的；所以無論她採取何種戰略，畢雷將選擇使行中支付最小化的戰略。反過來，畢雷剛好進行相反的推理。

解：最大化準則——對於二人零和博弈，選擇最大化其最小贏利的戰略對於每一個參與者來說都是理性的，雙方最大化其最小贏利的戰略對子和贏利對子就是「博弈的解」。

混合戰略（Mixed Strategy）

現在讓我們回顧一下「賭便士」博弈。這個博弈似乎沒有確定的解。最小的贏利在兩個戰略下是相同的：-1。但是這不是全部的故事。這個博弈可以有超過兩個的戰略。作為正面、反面兩個明顯戰略的補充，參與人可以一定的概率隨機選擇提供正面或反面，使其戰略「隨機化」。這樣的隨機戰略叫做「混合戰略」。兩個顯戰略，正面或背面，叫做「純戰略（pure strategies）」

古老的堆物博弈有一種很有意思的遊戲不知道你玩兒過沒有，就是有物體若干堆，可以是火柴棍或是圍棋子等等均可。兩個人輪流從堆中取物體若干，規定最後取光物體者取勝。這是我國民間很古老的一個遊戲，別看這遊戲極其簡單，卻蘊含著深刻的數學原理。下面我們來分析一下要如何才能夠取勝。（一）巴什博奕（BashGame）：只有一堆n個物品，兩個人輪流從這堆物品中取物，規定每次至少取一個，最多取m個。最後取光者得勝。顯然，如果n=m+1，那麼由於一次最多只能取m個，所以，無論先取者拿走多少個，後取者都能夠一次拿走剩餘的物品，後者取勝。因此我們發現了如何取勝的法則：如果n=（m+1）r+s，（r為任意自然數，s≤m),那麼先取者要拿走s個物品，如果後取者拿走k（≤m)個，那麼先取者再拿走m+1-k個，結果剩下（m+1）（r-1）個，以後保持這樣的取法，那麼先取者肯定獲勝。總之，要保持給對手留下（m+1）的倍數，就能最後獲勝。這個遊戲還可以有一種變相的玩法：兩個人輪流報數，每次至少報一個，最多報十個，誰能報到100者勝。（二）威佐夫博奕（WythoffGame）：有兩堆各若干個物品，兩個人輪流從某一堆或同時從兩堆中取同樣多的物品，規定每次至少取一個，多者不限，最後取光者得勝。這種情況下是頗為複雜的。我們用（ak，bk）（ak ≤ bk,k=0，1，2，...,n)表示兩堆物品的數量並稱其為局勢，如果甲面對（0，0），那麼甲已經輸了，這種局勢我們稱為奇異局勢。前幾個奇異局勢是：（0，0）、（1，2）、（3，5）、（4，7）、（6，10）、（8，13）、（9，15）、（11，18）、（12，20）。可以看出,a0=b0=0,ak是未在前面出現過的最小自然數,而 bk= ak +k，奇異局勢有如下三條性質：1。任何自然數都包含在一個且僅有一個奇異局勢中。由於ak是未在前面出現過的最小自然數，所以有ak >ak-1 ，而 bk= ak + k > ak-1 + k-1 = bk-1 > ak-1。所以性質1。成立。2。任意操作都可將奇異局勢變為非奇異局勢。事實上，若只改變奇異局勢（ak，bk）的某一個分量，那麼另一個分量不可能在其他奇異局勢中，所以必然是非奇異局勢。如果使（ak，bk）的兩個分量同時減少，則由於其差不變，且不可能是其他奇異局勢的差，因此也是非奇異局勢。3。採用適當的方法，可以將非奇異局勢變為奇異局勢。假設面對的局勢是（a,b），若 b = a，則同時從兩堆中取走 a個物體，就變為了奇異局勢（0，0）；如果a = ak ，b > bk，那麼，取走b - bk個物體，即變為奇異局勢；如果 a = ak， b < bk ,則同時從兩堆中拿走 ak - ab - ak個物體,變為奇異局勢（ ab - ak , ab - ak+ b -ak）；如果a > ak ，b= ak + k,則從第一堆中拿走多餘的數量a - ak 即可；如果a < ak ，b= ak +k,分兩種情況，第一種，a=aj （j < k）,從第二堆裡面拿走 b - bj 即可；第二種，a=bj （j <k）,從第二堆裡面拿走 b - aj即可。從如上性質可知，兩個人如果都採用正確操作，那麼面對非奇異局勢，先拿者必勝；反之，則後拿者取勝。那麼任給一個局勢（a，b），怎樣判斷它是不是奇異局勢呢？我們有如下公式：ak =[k（1+√5）/2]，bk= ak + k （k=0，1，2，...,n方括弧表示取整函數）奇妙的是其中出現了黃金分割數（1+√5）/2 =1。618...,因此,由ak，bk組成的矩形近似為黃金矩形，由於2/（1+√5）=（√5-1）/2，可以先求出j=[a（√5-1）/2]，若a=[j（1+√5）/2]，那麼a = aj，bj = aj + j，若不等於，那麼a = aj+1，bj+1 = aj+1 + j +1，若都不是，那麼就不是奇異局勢。然後再按照上述法則進行，一定會遇到奇異局勢。（三）尼姆博奕（NimmGame）：有三堆各若干個物品，兩個人輪流從某一堆取任意多的物品，規定每次至少取一個，多者不限，最後取光者得勝。這種情況最有意思，它與二進位有密切關係，我們用（a，b，c）表示某種局勢，首先（0，0，0）顯然是奇異局勢，無論誰面對奇異局勢，都必然失敗。第二種奇異局勢是（0，n，n），只要與對手拿走一樣多的物品，最後都將導致（0，0，0）。仔細分析一下，（1，2，3）也是奇異局勢，無論對手如何拿，接下來都可以變為（0，n，n）的情形。計算機演算法裡面有一種叫做按位模2加，也叫做異或的運算，我們用符號（+）表示這種運算，先看（1，2，3）的按位模2加的結果：1 =二進位01

2 =二進位10

3 =二進位11 （+）

0 =二進位00 （注意不進位）

對於奇異局勢（0，n，n）也一樣，結果也是0。任何奇異局勢（a，b，c）都有a（+）b（+）c=0。如果我們面對的是一個非奇異局勢（a，b，c），要如何變為奇異局勢呢？假設 a < b < c,我們只要將 c 變為a（+）b,即可,因為有如下的運算結果: a（+）b（+）(a（+）b)=(a（+）a)（+）(b（+）b)=0（+）0=0。要將c變為a（+）b，只要從 c中減去c-（a（+）b）即可。例1。（14，21，39），14（+）21=27，39-27=12，所以從39中拿走12個物體即可達到奇異局勢（14，21，27）。例2。（55，81，121），55（+）81=102，121-102=19，所以從121中拿走19個物品就形成了奇異局勢（55，81，102）。例3。（29，45，58），29（+）45=48，58-48=10，從58中拿走10個，變為（29，45，48）。例4。我們來實際進行一盤比賽看看：甲:(7,8,9)->(1,8,9)奇異局勢乙:(1,8,9)->(1,8,4)甲:(1,8,4)->(1,5,4)奇異局勢乙:(1,5,4)->(1,4,4)甲:(1,4,4)->(0,4,4)奇異局勢乙:(0,4,4)->(0,4,2)甲:(0.4,2)->(0,2,2)奇異局勢乙:(0,2,2)->(0,2,1)甲:(0,2,1)->(0,1,1)奇異局勢乙:(0,1,1)->(0,1,0)甲:(0,1,0)->(0,0,0)奇異局勢甲勝。

不會用博弈論害死了關羽

有人認為當時蜀國與魏、吳結怨很深，而荊州位於魏和吳夾擊之中，必然失守，諸葛亮應該認識到這一點，但還是讓關羽留守荊州，因此關羽之死諸葛亮應負一部分責任。筆者持不同的看法，從博弈論的角度論證關羽之死責任不在諸葛亮，而在於關羽自己不會用博弈論。

正因為荊州位於魏和吳的夾擊之中，時時處於不穩定之中，才有劉備不遠千里去攻取西川，爭取一個穩固的根據地。因此說守衛荊州確實是一件難事，但並不是說肯定失守。我們可以建立一個博弈模型來進行考慮。

當時的實力分析：

（1）魏、吳單獨和關羽交鋒。魏、吳單獨和關羽比處於下風或至少勢均力敵（從關羽和曹操的交戰中可以看出這一點），任何一方和關羽力拚必然損兵折將，另一方則可趁虛而入，不僅能夠取得荊州大部分地區，還避免了和關羽正面交鋒的損失。設此時單獨作戰收益為X，因為單獨作戰，另一方會偷襲，從而自己得不到荊州，有X<0；趁另一方作戰，本方不戰而偷襲則會有收益Y1，Y1>0。

（2）雙方都對關羽作戰，則關羽首尾不能兼顧，關羽必敗。但此時魏吳也會有一定的損失，取勝後為拼搶共同勝利的果實——荊州，雙方也會再起戰事，因此此時的收益必定不如本方不戰而偷襲所得的收益，設此時雙方的收益各為Y2（0<Y2<Y1）。

（3）雙方都不對關羽力拚，則偷襲不會成功，魏吳的收益均為零。

我們可以把此博弈的支付矩陣列表如下

力拚偷襲

力拚（Y2，Y2）（X，Y1）

偷襲（Y1，X）（0，0）

註：X<0<Y2<Y1。< P>

我們可以看出，理論上，雙方都力拚對魏和吳來說是最好的結果（Y2，Y2），但雙方都會認識到：假如對方力拚，自己的偷襲所得將是Y1！Y1>Y2，更壞的結果莫過於自己力拚，對方偷襲，自己將遭受損失（X<0）。因此最明智的結果是自己不力拚而偷襲。因此說這個博弈的納什均衡是（0，0），即雙方都會等待對方力拚，結果偷襲都不會成功。這和囚徒困境是一個道理。

如果雙方都是經濟學上的理性人，那麼結果會是（0，0），關羽不會死。但不幸的是曹操充當了傻子，與關羽力拚，搞得「水淹七軍」不說，荊州九郡還全部落入孫權之手。諸葛亮則不愧為高人，看來他那時對博弈論已經很清楚，而且運用自如（中華民族早已把博弈論運用於戰爭之中，比那個納什早了上千年），因此才囑咐關羽切不可對一方窮追猛打，否則會兩面受敵，只守不攻乃為上上策。

只要聽從諸葛亮的建議，短期內荊州不會失守，等巴蜀穩定下來，魏、吳更會有所忌憚，不敢強攻荊州，那時荊州就會相對穩固起來。因此說荊州是可以守衛成功的。

此時不得不提的一個人物是劉備，劉備此人對別人疑心很大。守衛荊州最合適的人選莫過於趙雲，但無奈趙雲非劉備的嫡系，劉備最信任的還是自己的結拜兄弟關羽和張飛，適才派關平來荊州，暗示諸葛亮要關羽留守荊州。諸葛亮很熟悉關羽的個性——自傲、容易意氣用事，派他守荊州不會聽從自己的建議，可能會出問題，無奈這是劉備的意思，諸葛亮也沒有辦法，在臨走前還千叮嚀萬囑咐關羽不要衝動，但最終關羽還是沒聽諸葛亮的話，死攻樊城，令陸遜偷襲成功，導致自己敗走麥城。

因此說，關羽的死並不是諸葛亮的錯，而是關羽自己不會用博弈論的結果。假如他明白其中厲害，不主動進攻，或見好就收（水淹七軍後馬上收手），可能不會令陸遜有機可乘。

劉備也應當負一部分責任，他信不過諸葛亮的人選——趙雲，而把並不適合的人選關羽往刀口送。這種用人上的錯誤，也直接導致了以後張飛和劉備自己的死。

博弈論在戰爭中的應用很多，遠的不提，拿二戰時的蘇聯來說，他一方面要對德國作戰，另一方面小日本對他也不斷騷擾。但斯大林深得博弈論之精髓，在與日本的交鋒中即使勝利了也草草簽署一個戰和協議了事，並沒有對小日本窮追猛打，才得以專心對德國作戰，也才有了最終的勝利。當然從我們中國的角度來說，斯大林做得很不人道，但從蘇聯的角度來考慮，斯大林卻是採取了最好的戰略。話說回來，假設當時蘇聯對日本猛打，小日本也不會侵佔中國那麼多土地，中國不會遭受那麼大的損失，日本更不會冒傻氣去偷襲珍珠港，美國不一定那麼快參戰，歷史可能因此而改寫。