標籤:

漫談博弈論

「博弈論」大家肯定都聽說過,印象中,這可是個「高大上」的理論。那麼,在專業研究者的眼中,博弈論又是個什麼樣子呢?

名正則言順

在介紹內容之前,不妨先來看看「博弈論」這個名字是怎麼得來的吧。

「博弈論」這個術語出自英文「Game Theory」,直譯就是「遊戲理論」。當然,這個直譯有點直白、不夠嚴肅,現在已經被遺棄了;而「博弈論」則典雅華貴一些,現在已是標準譯名,至少在中國內地是這樣。而台灣地區譯成「賽局理論」,聽起來跟遊戲更接近了,但是容易讓人聯想到「田忌賽馬」,我覺得是一個比較糟糕的譯名。至於為什麼說「容易讓人聯想到『田忌賽馬』的譯名就不太合適」,後面我們還會說到。

此外,「對策論」這個譯名,也在內地大量使用。比如,國內博弈論研究的一個重要學術組織就叫「中國運籌學會對策論分會」。應該說,「對策論」也是一個非常精彩的譯名,因為博弈論是決策理論的一個分支,從決策到對策,從構詞來看非常優美;而且雖然仍有一些誤導的成分,但研究對象和研究意義基本也都不言自明了。

打個不見得很恰當的比方,在「Gone With TheWind」的常見譯名中,「飄」大家公認是最精彩的,而「亂世佳人」的流傳也很廣。它們就好比是「博弈論」和「對策論」之於「Game Theory」的翻譯。

但是,在通常語境下、尤其是在媒體報道里,「博弈」還能作為一個動詞來使用,諸如「中美博弈」、「勞資博弈」等等。這跟學術語境下想表達的意思是基本一致的,可以產生非常恰當的聯想;而「對策」這個詞一般不作為動詞使用,在日常語境中也產生不了我們所期望的聯想。此外,「對策」跟「博弈」不同,它是單方視角而非全局視角,這也跟博弈論的研究方式相衝突。

總的來看,「對策論」的使用目前基本局限於運籌學和數學領域,而在其他領域和媒體報道中,「博弈論」這個詞已經佔據了壓倒性的優勢。

博弈無處不在

從研究對象來看,博弈論跟遊戲(尤其是棋牌遊戲)還真有著非常密切的關係;要不然,馮·諾依曼怎麼會無緣無故叫它「Game Theory」呢?那麼,博弈論的研究對象究竟是什麼呢?

博弈論的研究對象是「博弈」,從構詞法上來講,博弈論就是研究博弈的理論。所謂博弈,就是一個多人「互動決策」的環境。在這個環境下,至少兩個人需要做決策(同時或不同時),這些決策相互影響、相互依賴。對於每個人的每個決策來說,孤零零地說它好還是不好並沒有意義,因為每個人能有多少收益,不完全取決於他自己的決策,還要取決於其他人的決策(當然,自己的決策同時也會影響其他人的收益)。所以,博弈論更加貼切的學科名稱應該是「互動決策理論」。

記住上面這一點,然後到日常生活中去觀察,你就會驚訝地發現,博弈(注意不是博弈論!)簡直是無處不在:婚姻,是一場博弈——婚姻生活是否幸福,取決於(至少)兩個人的行動,而且完全可能一方覺得幸福、但另一方覺得不幸福(事實上,博弈論中有個著名的模型就叫「性別大戰」);高考,是一場博弈——考生能否考上理想的大學,不僅取決於自己的高考成績,更主要的是競爭對手(所有其他考生)的成績(但是大學英語四六級考試能否通過與別人沒有關係,就不要看成博弈了);股市,是一場博弈——每個人的收益,最終都取決於所有股民買進賣出的行為;在菜市場或淘寶店鋪里討價還價買東西,毫無疑問也是一場博弈。事實上博弈論的一個重要研究方向就叫「討價還價理論」!

玩團隊遊戲的時候,僅僅知道某玩家個人的行為,還很難判斷他究竟是「豬一樣的隊友」還是「神一樣的對手」,他的這些行為必須放到大環境中、結合其他玩家的行為,才能判斷是妙招還是蠢招。一個玩家是贏還是輸,也不僅取決於他自己怎麼出牌、怎麼走棋,還要看他的對手(和隊友),所以棋牌遊戲毫無疑問是博弈。

在博弈論的早期研究和教科書中,也經常拿(簡化的)棋類遊戲和撲克牌遊戲舉例子,因為它們分別代表了兩類重要的博弈,即「完美信息博弈」和「不完美信息博弈」。納什甚至還於1948年發明過一個新的棋種,名叫「六貫棋」(Hex),而蓋爾還利用六貫棋的變形,令人吃驚地證明了博弈論中至關重要的「布勞維爾不動點定理」!六貫棋在美國普林斯頓大學頗為流行過一段時間,大家就直接稱呼它為「納什」。當然,後來發現這個遊戲其實在更早的1942年就已經被丹麥數學家海恩發明出來了,納什不過是重新發明了它。

然而,學習和研究博弈論,對於提升任何棋牌和電子遊戲的競技水平都不會有絲毫幫助,而且博弈論也不是為了研究棋牌遊戲、更不是為了提升遊戲技能(儘管它叫Game Theory)才被發明出來。

為什麼這麼說呢?這就需要我們對博弈論的起源、基本假設和研究範式有一個大致的了解才行。

《美麗心靈》之外的數學天才

博弈論之所以會被廣大公眾所了解,除了一屆屆宣傳和造勢都很成功的諾貝爾經濟學獎之外,更要歸功於一部優秀的美國電影《美麗心靈》(A Beautiful Mind)。通過這部電影,很多人認識了數學天才納什(John Nash),也由此知道了博弈論。

納什對博弈論的貢獻的確是奠基性的,但說到「博弈論之父」這頂桂冠,卻應該戴在另一位數學天才馮·諾依曼(John von Neumann)的頭上。有人說馮·諾依曼是納什的導師,其實納什的導師是優化理論里著名的「KKT條件」(Karush-Kuhn-Tucker最優化條件)中的T(塔克)。

眾所周知,馮·諾依曼還被公認為「計算機之父」。我不知道是不是因為擔心一個傳奇(馮·諾依曼)會沖淡另一個傳奇(納什),結果在《美麗心靈》中沒有給馮·諾依曼以任何戲份,這真的很遺憾。

其實,在納什和馮·諾依曼以前,數學家策梅洛和波雷爾,經濟學家埃奇沃思、古諾、伯川德、斯坦伯格等的研究,都與博弈論有非常密切的關係。據著名的博弈論學家賓默爾考證,「均衡」的思想甚至可以追溯到18世紀與亞當·斯密同時代的哲學家大衛·休謨。但是直到1928年,馮·諾依曼證明了二人零和博弈的極大極小定理,才被公認為是博弈論正式誕生的標誌。這不僅是博弈論領域的第一個實質性結果,而且迄今為止,仍然是整個博弈論領域最核心、最重要的幾個結果之一。

1944年,馮·諾依曼和摩根斯坦恩合著出版了劃時代巨著《博弈論和經濟行為》(不過,學術界公認後者對該書內容基本沒有實質性貢獻),這是博弈論發展史上的又一個里程碑事件。該書一經出版就引起了學術界(主要是數學界)的巨大轟動,並吸引了一大批最優秀的年輕人(包括納什、夏普利、奧曼等)追隨研究,形成了博弈論歷史上無出其右的「普林斯頓學派」。馮·諾依曼寫作該書的終極目的,是嘗試用博弈論的框架為經濟學建立一個堅實的理論基礎,使其能像物理學一樣成為一門嚴格的科學。但殘酷的是,在這部六七百頁的皇皇巨著中,能留在現代博弈論教科書的內容卻並沒有多少,而且今天也很少有人再去研讀它了。由於研究對象的差別,馮·諾依曼的終極目的或許永遠也無法實現了。

不過,馮·諾依曼的部分目標至少還是實現了。從上世紀80年代開始,越來越多的經濟學家進入了博弈論的領域,在博弈論這個工具的幫助下,經濟學的經典理論已經在一定程度上被改寫了。今天的經濟學研究、尤其是微觀經濟學研究,已經完全離不開博弈論了,這也是為什麼博弈論這個領域會一次又一次地被授予諾貝爾經濟學獎的根本原因。

有人可能會問:既然馮·諾依曼這麼牛,他怎麼沒獲得諾貝爾經濟學獎呢?我們知道,諾貝爾經濟學獎跟物理學獎、化學獎等還不太一樣,它並不是諾貝爾遺囑中的獎項,而是瑞典銀行以紀念諾貝爾為名頒發的獎項。雖然它也和其它諾貝爾獎一塊頒發,但是獎金並非來自諾貝爾基金會。1969年諾貝爾經濟學獎首次頒發,但早在1957年馮·諾依曼就已經去世了(諾貝爾獎只頒發給在世的人)。至於博弈論被經濟學界廣泛認可,也是從20世紀八九十年代才開始的,直到1994年,該獎才首次頒發給博弈論這個領域。

更好地分析戰爭和國際關係,也是馮·諾依曼創建博弈論的初始目的之一。在當時的國際環境下,這是很容易理解的,而馮·諾依曼堅持不懈地研究零和博弈,也正是出於這個原因。已故的以色列博弈論學家馬席勒,當年在美國發明了談判集概念後,很長一段時間受美國中央情報局的專人保護,因為美國怕前蘇聯把這個概念偷走。眾所周知,戰爭是人類有歷史以來最大的傷痛來源之一。為了步入永久的和平,人們必須對戰爭的邏輯有深刻的理解,這與「為了治療癌症,必須對癌症的機制有深刻理解」是一樣的道理。博弈論的集大成者、以色列博弈論學家奧曼,在2005年榮獲諾貝爾經濟學獎的獲獎致辭的題目就是「戰爭與和平」,而同年的另一位諾貝爾經濟學獎得主謝林,他的獲獎原因之一,也是利用博弈論令人信服地分析了冷戰形勢。

所以,愛玩遊戲的讀者可能要失望了,博弈論創立的目的根本不是研究什麼棋牌遊戲,而是經濟、戰爭這類「高大上」的命題。

細說起來,無論是戰爭也好、經濟也罷,博弈論分析的都是有衝突的局面。事實上,博弈論也可以被稱為「衝突分析理論」,用以研究大家的利益相互有影響、有衝突的情況下的決策問題。

根據筆者歸納,衝突大概可以分為「價值觀和信仰衝突」(比如,相戀男女因為宗教信仰不同而無法結婚)、「認知衝突」(比如夫妻就「是否現在買房」無法達成一致,因為一方認為房價還會走高,另一方則認為拐點已經來臨)、「生活習慣衝突」(比如一方愛整潔,另一方很隨便)以及「經濟利益衝突」(比如離婚時的夫妻財產糾紛)等幾類。而博弈論所研究的,主要就是其中的經濟利益衝突。相對而言,經濟利益衝突更容易調和、尋求到中間方案從而達成妥協,所以利用博弈論對其進行分析才能取得巨大的成功。

與此同時,博弈論也是一門研究大家如何更好合作的學問。衝突與合作是人類的永恆話題,是一枚硬幣不可分割的兩面。如何化解衝突、走向合作,是人類文明和人類社會得以存在的基礎。「加深了人類對於衝突與合作的理解」,這正是諾貝爾經濟學獎委員會給奧曼和謝林的頒獎詞。

無比聰明、從不犯錯的人在一起博弈,最後會怎樣?

前面已經提到,棋牌遊戲都屬於博弈。如果從博弈論的視角來看待它們,又能帶給我們什麼新鮮的東西呢?

要回答這個問題,就要涉及到博弈論的基本假設和研究範式了。

經典博弈論研究中的一個基本假設,就是參與人是完全理性的(演化博弈論除外,那裡的基本假設是另外一個極端)。

那麼,什麼叫「完全理性」呢?對此,學術界還沒有完全研究清楚並達成一致意見。但對於博弈論來說,這是一個非常核心的問題(事實上,世界著名的以色列希伯來大學博弈論研究中心,它的名字就叫「理性研究中心」)。

簡單來說,「完全理性」指的是參與人足夠聰明、擁有無窮的計算和推理能力,而且從來不會犯錯誤。

博弈論研究的主要範式就是:如果大家都這樣聰明,最終會出現一個什麼結果呢?博弈論里把最終可能出現的結果稱為「納什均衡」。所謂納什均衡,就是這樣一種局面:對於每個人而言,如果其他人都不改變他們行為的話,那麼他也不願意改變自己的行為。直觀上講,一個均衡結果就是一個穩定局面,一旦出現就不會發生變化。博弈論的主要研究內容,就是這種均衡是否存在,如果存在的話有什麼性質。比如,納什最著名的研究結果,就是「如果參與人的個數有限、而且每個參與人的策略個數也有限的話,那麼混合策略納什均衡一定存在」(當然,什麼叫「混合策略」學術界也意見不一。總之,它不等價於我們通常所認為的隨機策略)。因此請注意,「納什均衡」的存在是有條件的,並不像有些人理解的永遠存在。

不過,大家要都是那麼聰明的話,遊戲還有什麼好玩的呀?早在1913年,集合公理化的代表人物之一、德國數學家策梅洛就證明了:二人遊戲中如果不出現循環局面(多數棋類遊戲的規則都限制出現這種現象),那麼均衡一定存在——要麼先行者必勝,要麼後行者必勝,要麼一定是平局。納什則證明了,他發明的「六貫棋」(Hex)的均衡結果肯定不是平局。這就是博弈論不能提升遊戲競技水平的原因,而且用博弈論的視角來看待棋牌遊戲,其實也非常無趣。博弈論現在有一個研究分支叫「組合博弈論」,專門研究各類棋牌遊戲,最近在《國際博弈論雜誌》(InternationalJournal Of Game Theory)上還有一期專刊介紹這方面的最新進展。但老實說,這類研究不屬於博弈論的主流研究方向,不是說它不重要,而是我認為它更多地應該被歸類到計算機科學和人工智慧的領域。

你可能要問:既然現實中的人遠沒有博弈論里假設的那麼聰明,所謂的「完全理性假設」不就是很荒謬的嗎?其實,這正是很多人批評甚至攻擊博弈論和理論經濟學的主要依據。這是一個很大的問題,本文無法展開論述,只能給出一些簡要的解釋。我的回答很明確:這樣假設肯定不完美,但是絕對不荒謬;拋棄這個假設的研究非常有意義,但是基於此假設的研究也永遠不會過時。具體而言,這裡包含著4個方面的問題需要解說。

首先,不能簡單地以「假設是否符合現實」來評判一個模型的好壞。任何模型都只是現實世界的近似,好的模型和假設是對現實世界的抽象而非扭曲,能幫助研究者抓住所研究問題的主要矛盾而拋開不重要的細節。至於什麼是好的假設、什麼是壞的假設,對任何具體問題來說,這都是一件很微妙的事情,學術界內部也經常有非常大的爭議。正像著名統計學家鮑克斯所講,「所有模型都是錯誤的,但是有些是有用的」。完全理性模型就是非常有用的。

其次,理論研究除了用來解釋歷史、理解現實和預測未來以外,還可以被作為基準比較對象(benchmark)。基於完全理性假設的模型,有時候可以對現實有非常好的逼近。更重要的是,它永遠可以作為一個理想的基準比較對象,這就像物理中的普通力學可以假設物體處於真空中一樣。真實的世界可以紛繁蕪雜、不斷變化和演進,但是基準比較對象卻可以比較簡單、永遠不變,這也正是某些學者所講的「理論模型比現實更真實」的準確含義。

第三,博弈論中有一個研究方向叫「有限理性模型」,從20世紀90年代開始就吸引了學術界的大量關注。這個方向的基本假設,就是人沒有那麼聰明、沒有那麼理性。不可否認,這是非常有意義的一個方向。但是,什麼叫「有限理性」?這仍是一個遠未達成共識的問題,而且它要比「完全理性」具有更多的歧義。幾乎所有基於完全理性假設的模型都是相通的,所以也可以說,本質上只有一個完全理性模型;但是有本質差別的有限理性模型,卻可以有非常多個。這是很容易理解的,因為完美的東西永遠只有一個,它要具備所有的優點;不完美的東西卻可以因為種種不同的原因,而呈現為各自的不完美(有人將上述邏輯稱之為「托爾斯泰效應」,你知道為什麼嗎?)所以,具有「完美性」和「唯一性」,也是完全理性模型可以作為基準比較對象的原因。

最後,博弈論還有一個比較前沿的研究方向叫「行為博弈論」,主要是用試驗的辦法來研究現實中大家玩各種博弈的時候,究竟會出現什麼結果。總的發現是,它的很多結果與博弈論的分析有較大的出入。能發現現實中大家決策的真實規律,這當然是非常有意義的工作;但是,並不能用這些實驗結果來簡單地否定依靠完全理性模型得出的結論。經常有科學家宣稱,他們的實驗結果推翻了經典博弈論的預測。這是非常不合適的說法。對於經典博弈論來說,預測只是它的幾個功能中最不重要、最當不得真的一個,何況很多的實驗控制還不能做到非常嚴格,實驗室里的博弈跟經典模型中的假想實驗還有較大差距。退一步說,即便是實驗控制真的足夠嚴格、足夠使我們信服「經典結論不符合現實」,作為基準比較對象,完全理性模型也仍然有其永遠存在、永遠值得研究的價值。

事實上,完全理性模型、有限理性模型和行為博弈論,是三個各擅勝場並互相補充的研究方向,都有其存在的價值,沒有簡單的誰對誰錯、誰好誰壞之分。值得一提的是,相比較另外兩個研究方向,完全理性模型還有一個巨大的優勢:它不怕參與人具有學習能力並變得越來越聰明,也不怕宣傳自己的結論,隨著時間的流逝,它只會變得越來越正確(即具有「自我應驗性」)。但是對於有限理性模型和行為博弈論,隨著大家學習和變得越來越聰明,今天發現的規律明天有可能就不成立;而且隨著其結論的傳播,後續情況會變得越來越不靠譜,即具有某種「反自我應驗性」。所以,如果你相信大家真的會變得越來越聰明,信息傳播會日益通暢,那麼就不要懷疑完全理性模型存在的價值!

【框文】

「田忌賽馬」和《孫子兵法》是博弈論的老祖宗嗎?

有些國內文章聲稱,博弈論的源頭在中國,「田忌賽馬」的故事和《孫子兵法》中的某些策略就是博弈論的始祖。

不可否認,孫臏是個很聰明的傢伙,《孫子兵法》也是部偉大的軍事著作,我們還可以從博弈論的視角重新從這個故事和這部書中解讀出很多東西。但是,他們對博弈論本身都沒有任何貢獻。

齊威王會被田忌和孫臏用同樣的辦法欺騙多次嗎?如果敵我雙方都仔細研讀《孫子兵法》,它裡面的很多招數還管用嗎?沒有完全理性的假設和均衡的思想,我們就不能說任何的故事或計謀中蘊含博弈論的思想。

所以,「田忌賽馬」也好、《孫子兵法》也罷,硬給它們戴上「博弈論始祖」的光鮮帽子,只能惹人笑話而已。

【框文完】

沒落的貴族:合作博弈論

儘管在一些自然科學領域也有應用,但博弈論基本上還是應該劃入社會科學範疇,因為它研究的是人與人之間的互動。與其它社會科學一樣,博弈論的研究也大致有兩種範式,即實然性(positive或descriptive)研究,和應然性(normative或prescriptive)研究。

粗略來講,「實然性研究」想知道現實社會是什麼樣子,「應然性研究」想探索理想社會應該是什麼樣子;前者想了解現實,後者則計劃改變現實。對於應然性研究來說,「實踐是檢驗真理的唯一標準」不能僵化使用,不能因為研究結論跟現實不相符合就否定其意義;恰恰相反,正是因為結論跟現實不一致,才更能體現出其研究價值,利用該研究來改變現實也才更有意義。儘管一項具體的研究「究竟屬於實然性研究還是應然性研究」並不總是個好回答的問題(因為有時候是混在一起的),但是經常問問這個問題,也還是很有意義的。

我們前文介紹的內容,大致局限於實然性研究的範圍。粗略劃分,博弈論有兩大研究分支,即「非合作博弈論」(也稱策略博弈論)與「合作博弈論」(也稱聯盟博弈論)。大致而言,非合作博弈論主要採取實然性研究範式,合作博弈論主要採取應然性研究範式(當然這種劃分非常不嚴格)。所以說,我們前文的討論主要局限於非合作博弈論的範圍。博弈論的另外一些方向,確切來說應該是博弈論的兩個應用分支,即「機制設計」(2007年獲獎方向)和「市場設計」(2012年獲獎方向),則走得更遠,研究我們如何才能實現一些理想的目標。

我們介紹了這麼多,但到現在還沒有展開介紹合作博弈論,這當然不是無緣無故的。實際上,博弈論的形象主要是由非合作博弈論這個分支塑造的;至於合作博弈論,則可謂是一個十足的沒落貴族了!

歷史上,合作博弈論的研究曾經非常輝煌。比如,前文提到的馮·諾依曼和摩根斯坦恩的那本書中,有2/3以上的內容都屬於合作博弈論(儘管那時候還沒有合作博弈與非合作博弈的區別);到了20世紀五六十年代,博弈論的主流研究仍然絕對是合作博弈論。但是慢慢地,從20世紀七八十年代開始,非合作博弈論越來越成為主流,並將壓倒性優勢保持到了今天。在博弈論中,幾乎所有的成熟應用都來自非合作博弈論,而合作博弈論這個方向,迄今為止也沒有獲得過任何一屆諾貝爾經濟學獎。

合作博弈論這個方向之所以沒有獲獎,一個重要原因就是:如果獎勵這個方向的話,肯定會獎給夏普利,而不是奧曼或其他人。有人可能會立即反駁說:2012年,夏普利不就已經和羅斯一塊獲獎了嗎?這個問題,又涉及到另外一個流行的錯誤觀念。是的,他們的確獲獎了,但是獲獎原因很明確,是因為對穩定匹配和市場設計理論的巨大貢獻,而不是合作博弈論。有的學者可能會爭論說,「穩定匹配集不就是合作博弈論里核心(core)的概念嗎?所以穩定匹配理論就是合作博弈論的一個應用,穩定匹配理論獲獎就應該算做是合作博弈論獲獎」。這種爭論非常牽強,儘管穩定匹配集在匹配問題里跟核心的確是等價的,蓋爾和夏普利的經典論文里也注意到了這一點。首先,「核心」這個概念的應用並不本質,沒有它絲毫不影響穩定匹配的整套理論和應用。它對於穩定匹配理論是輔助性的:能帶來一個有趣的新視角,但是僅此而已。所以多數場合介紹穩定匹配理論的時候根本就不提核心這個概念,而多數合作博弈論的書籍也不介紹穩定匹配理論(最多作為一個小例子)。其次,即便是核心這個概念對於證明穩定匹配的一些理論必不可少,也不能說是它獲了獎,正如我們不能說不動點理論獲得了1994年的諾貝爾經濟學獎一樣。何況核心這個概念對於穩定匹配理論,其重要性遠比不上不動點定理對於非合作博弈論。最後,由於諾獎的示範效應,最近幾年越來越多的學者開始從事穩定匹配和市場設計理論的研究,但是合作博弈論的經典研究範式並沒有因此而受到格外的關注。儘管這種現象是否合理完全屬於另外一個問題,它從一個側面反映了學術界對於這兩個研究分支的清晰界定。

【框文】

「合作博弈論研究合作,非合作博弈論研究不合作?」

有一個流行的錯誤觀念認為,合作博弈論是研究合作的,而非合作博弈論則研究競爭和衝突。其實,這是簡單的望文生義。所以,當奧曼和謝林因為「加深了人類對於衝突與合作的理解」而獲得2005年諾貝爾經濟學獎的時候,就有中國學者宣稱,合作博弈論被授予諾貝爾經濟學獎了。這種宣稱當然是錯誤的。事實上,非合作博弈論和合作博弈論都研究合作與衝突。

我們前面已經提到,衝突與合作是一個事物的兩個方面,博弈論的核心研究目的(至少之一)就是解決衝突、達成合作。比如,非合作博弈里的一個重要研究分支「重複博弈」,主要就是研究「一次博弈無法形成的合作局面,如何在多次博弈中達成」。合作博弈里,各種解的概念也必須考慮到所有人的利益,盡量讓所有的參與人都滿意。作為銜接非合作博弈論與合作博弈論的「討價還價理論」,更是把衝突與合作這個兩位一體的話題體現得非常顯著。

當然了,大家望文生義也不是無緣無故的,這兩個分支的名字起得太容易讓人產生這種聯想了。衝突與合作是博弈論的核心研究話題,那麼「合作博弈論研究合作,非合作博弈論研究競爭與衝突」,聽起來似乎就非常順理成章了。所以,包括奧曼在內的博弈論學家,都建議用「策略博弈」和「聯盟博弈」的術語來分別替換「非合作博弈」和「合作博弈」。儘管他們的號召得到了很多人的響應,前兩個術語在文獻里也被大量使用,但是容易讓人望文生義的後兩個稱呼,至今仍佔據主導地位。

【框文完】

那麼,合作博弈論現在沒落到了什麼地步呢?你大概想像不到,它居然已經沒落到了連世界最著名的一些教科書中都隻字不提的程度!在這種完全被忽視、被邊緣化的背景下,國內有的經濟學家就公然宣稱「博弈論的全稱是『非合作博弈論』」,鬧出了大笑話。這當然是無可爭辯的低級錯誤,但這個錯誤也清晰地顯示出了合作博弈論的尷尬學術地位。

不過,幾乎所有重要的博弈論學家都認為,合作博弈論是博弈論的核心組成部分。由於合作博弈論的建模跟非合作博弈論相比更宏觀一些、忽略了更多細節,這使得某些時候用合作博弈論來建模比非合作博弈模型有更多優勢(比如預測結果的魯棒性等)。合作博弈論目前發展的不景氣,當然也有其內在的根本原因,比如一般總是假設「大聯盟會形成」。不少著名的博弈論學家(包括2007年諾獎得主馬斯金)都曾經或正在嘗試突破經典的合作博弈研究框架,試圖重現其輝煌。

合作博弈論當年如此輝煌、如今又這般沒落,究竟是誰改變了它的發展軌跡呢?不是別個,正是大家最熟悉的納什。當馮·諾依曼的所有追隨者捧著他的「聖經」去研究極大極小定理的各種數學推廣、試圖證明書中遺留下來的最大公開問題(穩定集的存在性)的時候,納什深刻地洞察到「直接將極大極小解的一個性質作為一個獨立概念」的必要性。這個概念,就是前面說到的納什均衡(當然,納什自己不會起這樣一個名字,這是後人表示對納什的尊敬才這樣稱呼的)。據說,納什將自己的成果介紹給馮·諾依曼的時候,後者很不以為然。是的,納什證明納什均衡存在性的時候並沒用到什麼高深的東西,布勞維爾不動點定理不僅對於馮·諾依曼不是什麼新鮮玩意,當時的數學家也都比較熟悉;而且不可否認的是,納什均衡這個概念遠沒有極大極小解完美。

但是,正是納什和這個並不完美的概念,極大地拓寬了博弈論的研究範圍,並在經濟學中找到了令人信服的應用,最終在一定程度上實現了馮·諾依曼「用博弈論為經濟學建立堅實的理論基礎」的夙願。

那麼,納什為什麼這麼重要、諾貝爾經濟學獎委員為什麼會為了他寧願等幾年才給博弈論這個學科頒獎,也就不言自明了。

博弈論算不算數學?

從我們剛剛講到的納什工作的重要性里,讀者已經可以多少體會到博弈論跟數學的不同了。現在,我們將更加詳細地闡述這樣一個觀點:儘管數學對於博弈論非常重要,博弈論裡面也有很多深刻而有趣的數學問題,但博弈論不是數學的一個分支,它跟數學的研究範式有很大的差異。

正如我們前面已經講到的,博弈論是天才數學家馮·諾依曼提出的,另一個天才數學家納什則奠定了現代博弈論的基礎,至於早期的博弈論學家,幾乎全部是數學專業甚至純數學專業出身。在今天,沒有一定的數學基礎而想要比較深刻地理解博弈論的主要內容或者成為一名博弈論研究者,幾乎是不可能的事情(像謝林那種不用數學的博弈論學家,在學界幾乎是沒有第二例的)。

但是,博弈論畢竟不是數學,它跟數學的研究範式有明顯的差異。正如我們前面講的那樣,博弈論是一門社會科學,研究的是現實世界中人的決策行為,所以需要建模、需要研究者對社會和人的行為有比較深入的了解和洞察;而數學是跟自然科學和社會科學並列的一門學科,嚴格來講我們都不應稱之為科學(如果按照一般的理解,將「科學」定義為研究現實世界的學問的話)。數學只是在邏輯和結構的「可能世界」里尋求規律,而科學則在「真實世界」里尋求規律。從這個角度說,數學比科學的研究對象更普世,這也是數學可以作為工具應用到科學中的原因。邏輯和結構的可能世界遠比真實世界簡潔得多,因為它拋棄了更多的細節,這也是數學推理的鏈條可以長得令人吃驚、數學內在的一致性緊密得令人吃驚的原因。所以,要成為一名優秀的數學家,完全可以不懂任何人情世故、可以對現實世界沒有任何了解而只活在自己孤獨的內心裡,這樣的例子比比皆是。但是,博弈論不是這樣的。通常來講,正像其它社會科學一樣,博弈論里研究結論的推理鏈條不會特別長,而且特別注重直觀解釋。

如果說,20世紀80年代以前的博弈論研究主要由數學家完成、大量的博弈論研究成果發表在數學類的期刊——比如頂級的《數學年刊》(Annals ofMathematics)——上面的話,那麼從那以後,越來越多的一流成果是由經濟學家完成的,而且更多的一流文章被發表在了經濟學領域的期刊上面。早期那些可以稱之為數學家的博弈論學家(除了馮·諾依曼以外),他們的名氣也主要是從經濟學領域獲得的,他們的工作是被經濟學領域而非數學領域認可的。

所以,優秀的博弈論學家獲得的是諾貝爾經濟學獎,而非數學領域的菲爾茲獎或沃爾夫獎。納什本人在純數學領域有傑出的貢獻,據說沒能如願獲得菲爾茲獎也是加劇他精神分裂病情的重要原因。但從那以後,能被稱為「傑出數學家」的博弈論學家已經日益稀少了,也已有幾十年沒有博弈論學家能在《數學年刊》或其他重要的、純數學家認可的頂級刊物上面發表文章了。此外,早期發表的那些以數學思維寫就的文章,在今天仍能被關注的也不是很多了。

但是,對那些我們能說出名字的重要的博弈論學家,說「他們同時也是經濟學家」基本上都沒問題。儘管夏普利一直說,自己是個數學家而不是經濟學家,他的一些工作(比如說隨機博弈)近些年也引起越來越多數學家的興趣,但是無論如何也無法否認的是,夏普利的工作在數學領域的影響,遠遠比不上他在經濟學領域的影響。到了今天,依然有很多數學家在研究博弈論裡面的數學問題,但我個人的觀點是,多數研究都離博弈論的核心理論有一定的距離。從學術研究的視角來看,博弈論早就跟數學漸行漸遠、並投入到經濟學的懷抱中了。

所以說,「博弈論是數學的一個分支」這個說法,遠沒有「博弈論是經濟學的一個分支」更靠譜。當然,後者也不完全正確,因為博弈論這門學科有其獨立性,更嚴格的說法是「博弈論是決策科學的一個分支」。

目前來看,博弈論應用最成功的領域是經濟學,但是20年、30年或50年以後,情況還是這樣嗎?是不是能有另外某一門學科,它應用博弈論的成熟程度能達到或接近經濟學呢?對此,誰也無法預料。

還需要特別提出的是,對於博弈論研究而言,真正重要的不是深刻的數學知識,而是嚴密的數學語言和形式化的抽象思維能力。還記得《美麗心靈》裡面的一段精彩情節,即「納什如何說服自己的確患有精神分裂症」嗎?妻子艾麗莎曾經多次告訴他精神出了問題,中央情報局也好、小女孩也好,都是他自己的幻覺。納什知道,妻子深深地愛著自己、不會欺騙自己,但是小女孩就在自己身邊啊。這就像數學悖論一樣折磨人。在這兩難的取捨中,理智告訴納什:只能相信自己的判斷。但是,納什最終還是改變了自己的判斷、相信了艾麗莎,因為他突然意識到,身邊的小女孩從來就沒有長大!這就是典型的數學家的思維。儘管電影跟真實的故事相去甚遠,編劇設計的這個絕妙情節還是讓我們佩服不已——它與笛卡爾的邏輯「我思故我在」真的有著異曲同工之妙!

順便提一下,很多人認為片名「美麗心靈」形容的是納什的妻子艾麗莎,而不是納什本人。 另外一個擁有和艾麗莎一樣美麗心靈的,就是納什的師兄庫恩(Kuhn),即前述KKT條件中的第二個K。他不僅是電影的數學顧問,更是納什一生的摯友,在納什被病魔困擾的30多年裡,始終精心陪伴和照顧著他。庫恩持續的呼籲和努力,也是納什能夠獲得1994年諾貝爾經濟學獎的關鍵因素之一。

中國今天的博弈論研究,老實說還很落後,其中一個重要原因就是多數經濟學背景的博弈論研究者,還不具備足夠的數學知識和抽象思維能力;而另外一方面,多數具有數學背景的博弈論研究者,則又把博弈論完全看成數學的一個分支、完全用數學思維進行研究,從而無法找到真正重要的問題,更無法提出有意義的新模型。

可喜的是,隨著越來越多在國外高水平的經濟院系受到嚴格正規訓練的年輕學者的回國工作,這一局面正在得到迅速改善。

不要神化、更不要庸俗化博弈論

我們前面提到,博弈論屬於社會科學,它在經濟學領域裡應用最廣泛、最成熟。其實,博弈論的應用已經遠遠超出了經濟學的範疇,在生物學、政治科學、計算機科學、心理學甚至醫學和哲學裡面,都已經找到了很好的應用。在社會科學裡面,博弈論的應用是如此廣泛而基礎,以至於它被譽為「社會科學領域的微積分」。

幾年前,奧曼提出了「博弈科學」與「博弈工程」的區別。後者的出現,充分說明博弈論這門學科正走向成熟。以其應用最成功的典範「拍賣」為例,著名博弈論學家賓默爾2000年為英國政府設計的「3G帶寬拍賣」,為政府賺取了幾百億英鎊。今天的網路在線廣告拍賣,是一個十分龐大的新興市場,也有非常多的科學家和工程師,在谷歌、臉書等公司從事著該領域的研究和設計。藉助於先進的IT和網路技術,複雜的拍賣可以很便捷地在線完成。很多人可能不知道,當我們每次在谷歌或百度的搜索框里輸入一個關鍵詞時,背後就有很多公司在通過競拍廣告來試圖吸引你的注意;而在我們敲擊回車鍵的同時,一次拍賣就已經悄無聲息地發生了。

博弈論也在慢慢滲入到我們的文化中,「博弈」這個詞已經日趨成為一個日常用語,不少電影和文藝作品中都能找到博弈論的影子。經濟學泰斗薩繆爾森曾說,「要在現代社會做一個有文化的人,你就必須對博弈論有一個大致的了解」。這句話,足以說明博弈論在人類知識結構中的重要地位。

博弈,在現實生活中簡直無處不在,它的應用廣泛而深入。但是,博弈論本身的分析能力還是相當有限的,尤其是當你想通過它來直接指導你的決策時,就更是如此。行為博弈論的很多研究成果已經告訴我們,用博弈論來直接預測現實,結果經常是不靠譜的。所以,頂級的博弈論學家魯賓斯坦甚至表達了「博弈論毫無用處」的極端悲觀的觀點,認為「博弈論學家,不過是和小說家一樣善於講故事而已」(但令人驚訝的是,他的這個觀點居然能發表在最頂級的《計量經濟學》雜誌(Econometrica)上!)。

絕大多數學者的觀點當然沒有這麼悲觀。但是,也不能走向另一個極端,即神化博弈論、以為它無所不能,或者以為只要有博弈的地方,博弈論就能發揮作用。這是一個很大的誤區。博弈在現實生活中真的幾乎無處不在,但是博弈論能告訴我們靠譜結論的情形還是非常少的。關於博弈論的研究,多數還是停留在博弈科學的階段,那也確實能給我們很多啟發,但是你不能太當真。

那麼,什麼時候博弈論的分析才能比較靠譜呢?我想,「賓默爾的三原則」有著很好的指導意義,即只有當一個博弈滿足下面三個條件中的至少一個時,博弈論的分析才有可能比較靠譜。這三個條件,分別是「比較簡單」、「激勵足夠大」及「參與人有學習和改正錯誤的機會」。

目前,國內有很多關於博弈論的劣質書刊,試圖告訴讀者怎樣用博弈論來炒股、怎樣在官場勾心鬥角、甚至怎樣去交女朋友等等。不能說他們介紹的那些「招數」完全沒有用處,但多數都只是打一個幌子而已,是在試圖神化或庸俗化博弈論。

現在,讓我們回到「遊戲論」這個對「Game Theory」的直譯上來。通過本文筆者想表達一個中心意思,就是不妨用「適當的、遊戲的心態」來看待和研究博弈論。博弈論的模型,經常是對現實中一大類相似情景和問題的簡化和抽象(比如「囚徒困境」是對個體理性與集體理性有尖銳衝突情景的抽象),是一些理想狀態下的假想實驗。這些假想實驗對於我們理解真實世界的邏輯非常重要,但是在真實世界中,可能很難找到完全一致的情景。公眾對博弈論沒必要過於仰視,對於它的一些理論可以當真,另一些理論則不要太當真。

玩各種遊戲的時候我們要在「當真」與「當不得真」之間拿捏好分寸。太不當真的話,欺騙不了自己,體會不到遊戲的樂趣;太當真入戲太深的話,則容易模糊生活的本來面目,忘記遊戲的初始目的。類似的,如果對博弈論太不當真的話,很容易陷入學術虛無主義;太當真的話,則會變成書獃子,喪失常識和自己的基本判斷力,忘記了博弈論的緣起與使命。至於如何在「當真」與「當不得真」之間拿捏好分寸,即便對於多數博弈論專業研究者來說也不是件容易的事情,或許整個學術生涯都需要好好體會:借用岳飛的名言,「運用之妙,存乎一心」。

(責任編輯:趙燕楓 作者:曹志剛)

(本文發表於《科學世界》2015年第1期;正式發表時雜誌社加了若干插圖;插圖及相關文字說明未經本人審校。)


推薦閱讀:

博弈論——納什均衡、囚徒困境
「讓狡猾女人不再欺負我」番外:我知道你知道我也知道你同樣知道我們應該在哪裡碰面
直播平台與遊戲廠商的博弈史:相愛相殺後將走向何方?
淺談博弈論在審訊過程中的運用

TAG:博弈論 |