什麼是博弈論與納什均衡

07-18

博弈論 :亦名「對策論」、「賽局理論」，是研究決策主體的行為發生直接相互作用時候的決策以及這種決策的均衡問題，具有鬥爭或競爭性質現象的數學理論和方法。也是運籌學的一個重要學科。博弈論考慮遊戲中的個體的預測行為和實際行為，並研究它們的優化策略。

納什均衡：又稱為非合作博弈均衡，是博弈論的一個重要術語，以約翰-納什命名。假設有n人局中人參與博弈，給定其他人策略的條件下，每個局中人選擇自己的最優策略（個人最優策略可能依賴於也可能不依賴於他人的戰略），從而使自己利益最大化。所有局中人策略構成一個策略組合。納什均衡指的是這樣一種戰略組合，這種策略組合由所有參與人最優策略組成。即在給定別人策略的情況下，沒有人有足夠理由打破這種均衡。納什均衡，從實質上說，是一種非合作博弈狀態。

近代對於博弈論的研究，開始於策墨咯，波雷爾及馮-諾伊曼。1928年，馮-諾依曼證明了博弈論的基本原理，從而宣告了博弈論的正式誕生。1944年，馮-諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經濟行為》將二人博弈推廣到n人博弈結構並將博弈論系統的應用於經濟領域，從而奠定了這一學科的基礎和理論體系。1950～1951年，約翰-福布斯-納什利用不動點定理證明了均衡點的存在，為博弈論的一般化奠定了堅實的基礎。納什的開創性論文《n人博弈的均衡點》（1950），《非合作博弈》（1951）等等，給出了納什均衡的概念和均衡存在定理。

此外，塞爾頓、哈桑尼的研究也對博弈論發展起到推動作用。今天博弈論已發展成一門較完善的學科。博弈論起源於研究人們玩撲克（poker）、象棋（chess）等室內遊戲時的行為決策，後來作為一種研究人類經濟行為的數學工具得到了充分的發展。從根本上講，博弈論涉及到從打網球到指揮戰爭的任何牽扯策略的情景。博弈論提供了一種計算各種可能決策所產生效益的數學方法，該理論為在各種競賽性場合做出最佳決定建立了一套具體的數學公式。正如經濟學家赫伯特-金迪斯（Herbert Gintis）所說，博弈論是我們「研究世界的一種工具」。但它不僅僅是一種工具，「它不僅研究人們如何合作，而且研究人們如何競爭」。同時，「博弈論還研究行為方式的產生、轉變、散播和穩定。」

博弈論與納什均衡的發展和應用

博弈論不是納什發明的，但他擴大了該理論的範圍，為之提供了解決實際問題的更有力工具。在一開始，他的研究成果並沒有受到人們的重視。他的文章發表在20世紀50年代，在當時博弈論僅在冷戰分析家之間流傳，這些分析家認為國際侵略和利益最大化之間有一些相似之處。在經濟學界，博弈論還被視為一種新奇事物。經濟學家薩繆-鮑爾斯（Samuel Bowles）告訴我說：「在當時博弈論羽翼未豐，如同經濟學中其它許多優秀的思想一樣，它還沒有受到人們的關注。」

然而在20世紀70年代時情況發生了改變，進化論學派的生物學家開始採用博弈論研究動植物中的生存競爭現象。緊接著在20世紀80年代，經濟學家終於開始以各種不同方式將博弈論應用於經濟學中，尤其是將它用在設計真實試驗以驗證經濟學理論方面。到80年代末博弈論在經濟學領域已經充分顯示了它的作用，這最終促成了納什等1994年諾貝爾經濟學獎的獲得。

早在此之前，博弈論就已經出現在許多學科的課程中。數學系、經濟學系、生物學系、還有政治科學系、心理學系和社會科學系的課程中都含有博弈論的內容。到了21世紀初，博弈論的應用更為廣泛，涉及到從人類學到神經生物學等多個領域。

現今，經濟學家繼續使用博弈論分析人們如何做出有關金錢的決策；生物學家用它來建立假說以解釋適者生存原理和利他主義的起源；人類學家使用它來研究原始文化，從而說明人性的多樣化；神經科學者也加入了博弈論研究的行列，通過研究博弈者的大腦，試圖發現決策如何反映人們的動機和情感。

簡言之，納什的數學理論連同在其在其基礎上建立起來的現代博弈論已經成為科學家研究眾多與人類行為相關課題時的首選方法。

博弈論和納什均衡的幾個經典案例

【智豬博弈（Pigs』payoffs）】豬圈裡有兩頭豬，一頭大豬，一頭小豬。豬圈的一邊有個踏板，每踩一下踏板，在遠離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一隻豬去踩踏板，另一隻豬就有機會搶先吃到另一邊落下的食物。當小豬踩動踏板時，大豬會在小豬跑到食槽之前剛好吃光所有的食物；若是大豬踩動了踏板，則還有機會在小豬吃完落下的食物之前跑到食槽，爭吃到另一半殘羹。

那麼，兩隻豬各會採取什麼策略？答案是：小豬將選擇「搭便車」策略，也就是舒舒服服地等在食槽邊；而大豬則為一點殘羹不知疲倦地奔忙於踏板和食槽之間。

原因何在？因為，小豬踩踏板將一無所獲，不踩踏板反而能吃上食物。對小豬而言，無論大豬是否踩動踏板，不踩踏板總是好的選擇。反觀大豬，已明知小豬是不會去踩動踏板的，自己親自去踩踏板總比不踩強吧，所以只好親力親為了。

【槍手博弈】王者的悲哀。三人對槍自決，甲乙丙槍法優劣遞減。最後無奈而神奇的結局，將不取決於同時開槍還是先後開槍，最優良的槍手，倒下的概率將最高；而最蹩腳的槍手，存活的希望卻最大。因為沒有人會把威脅最小的槍手列為一號清楚目標。在這裡，後發制人的弱勢者將勝出。以弱勝強，絕不是神話。

【囚徒困境】假設有兩個小偷A和B聯合犯事、私入民宅被警察抓住。警方將兩人分別置於不同的兩個房間內進行審訊，對每一個犯罪嫌疑人，警方給出的政策是：如果一個犯罪嫌疑人坦白了罪行，交出了贓物，於是證據確鑿，兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白，則兩人各被判刑8年；如果另一個犯罪嫌人沒有坦白而是抵賴，則以妨礙公務罪（因已有證據表明其有罪）再加刑2年，而坦白者有功被減刑8年，立即釋放。如果兩人都抵賴，則警方因證據不足不能判兩人的偷竊罪，但可以私入民宅的罪名將兩人各判入獄1年。

關於這個案例，顯然最好的策略是雙方都抵賴，結果是大家都只被判1年。但是由於兩人處於隔離的情況，首先應該是從心理學的角度來看，當事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當-斯密的理論，假設每個人都是「理性的經濟人」，都會從利己的目的出發進行選擇。這兩個人都會有這樣一個盤算過程：假如A坦白，B抵賴，B得坐10年監獄，B坦白最多才8年；B要是抵賴，A就可以被釋放，而B會坐10年牢。綜合以上幾種情況考慮，不管A坦白與否，對B而言都是坦白了划算。兩個人都會動這樣的腦筋，最終，兩個人都選擇了坦白，結果都被判8年刑期。

博弈論和納什均衡的重要影響

博弈論所研究的是理性的決策者之間衝突及合作的理論，可以為實際決策提供理論基礎和方向指導。其最終追求結果是使博弈方達到利益最大化的均衡。在生活中，博弈仍然無處不在。博弈論代表著一種全新的分析方法和全新的思想。諾貝爾經濟學獎獲得者保羅-薩繆爾遜如是說：要想在現代社會做個有價值的人，你就必須對博弈論有個大致的了解也可以這樣說，要想贏得生意，不可不學博弈論；要想贏得生活，同樣不可不學博弈論。

納什均衡理論奠定了現代主流博弈理論和經濟理論的根本基礎，正如克瑞普斯（Kreps，1990）在《博弈論和經濟建模》一書的引言中所說，「在過去的一二十年內，經濟學在方法論以及語言、概念等方面，經歷了一場溫和的革命，非合作博弈理論已經成為範式的中心，在經濟學或者與經濟學原理相關的金融、會計、營銷和政治科學等學科中，現在人們已經很難找到不懂納什均衡能夠『消費』近期文獻的領域。」