博弈論中的基本假設「共同知識」是怎樣體現在納什均衡的前提條件、推導過程以及結論中的?

就以完全信息靜態均衡為例說一下吧


這個問題恰好之前學習過一段時間,可以分享一些心得。(很驚喜有人添加了epistemic game theory的標籤,非常準確)

共同知識的定義最早是由哲學家Lewis提出,由Aumann引入經濟學領域。簡單說來,就是某個信息(實際上是定義在states和events上的)滿足:你知道,我知道,你知道我知道,我知道你知道,你知道我知道你知道,我知道你知道我知道……無限循環下去。

共同知識對博弈論的貢獻必須從兩條線索來談:共同知識和高階信念。共同知識剛才講過了;高階信念與之非常類似簡單地說就是我猜你的行動是什麼(一階),你猜我猜你的行動是什麼(二階),我猜你猜我猜你的行動是什麼(三階)……直到無窮階。

客觀的信息(知識)被主觀獲得後便成為了信念,即為了實現均衡必須使用共同知識來支持高階信念。(信念這個概念還有一個與知識相對的定義,表達你知道但是不一定是事實的事件。這個暫且不深究。)

回到博弈中,博弈決策與一般單人決策之間最大的區別在於博弈具有交互性,即你的決策收益取決於對方的決策。換句話說,你無法獨自直接決定自己的收益。在這種情況下,若想最大化自己的收益只能對對方的決策行為進行預測,並基於此選擇最大化自己受益的策略。

如果可以直接對對方決策結果進行準確預測,那麼自然自己的最優策略變呼之欲出了。此時,不需要高階信念,只需要彼此知道對方的決策結果即可,即共有知識(mutual knowledge)。這是Aumann的一個發現。所以非要說博弈均衡必須要求共同知識也不一定對:很強的共有知識也可以保證均衡解的實現。

上述共有知識雖然可以保證均衡解,但是假設實在是太強了:我們往往無法知道別人真正會怎麼選。因此我個人理解,這個解的概念更類似於事後概念,即當行動組合實現以後,從事後驗證此組合是否是均衡。但是從事前分析的角度,我們經常遇到的情況是需要猜測別人會做什麼,即對方的決策結果並不是直接知道的,我們必須做一些合理的預測。因此,我們需要高階信念。

為了看清楚這一點,以古諾均衡為例(來自Binmore)。假設市場價格p=X-q_{1}-q_{2},其中X為市場容量,q1,q2分別表示廠商1和2的產出。如果對於廠商1和廠商2來說,邊際生產成本為c1,c2,那麼他們的利潤可以寫作:

pi _{1}=(X-q_{1}-q_{2}-c_{1})cdot q_{1}\
pi _{2}=(X-q_{1}-q_{2}-c_{2})cdot q_{2}

進而得到最優反應函數:

q_{1}=(X-ar{q_{2}}-c_{1})/2\
q_{2}=(X-ar{q_{1}}-c_{2})/2

其中,ar{q_{1}},ar{q_{2}}分別表示廠商1對廠商2產量的推測以及廠商2對廠商1產量的推測。很明顯,廠商對彼此產量的推測也即是對對方決策結果的判斷。顯然每個廠商都無法知道對方的實際決策是什麼,但是卻知道對方也是利潤最大化的,因此,他們可以進一步對彼此進行推測:

ar{q_{2}}=(X-ar{ar{q_{1}}}-ar{c_{1}})/2\
ar{q_{1}}=(X-ar{ar{q_{2}}}-ar{c_{2}})/2

其中ar{ar{q_{1}}},ar{ar{q_{2}}}表示廠商的二階推測,分別指廠商1對廠商2對廠商1產量的推測,以及廠商2對廠商1對廠商2產量的推測(為了與保持一致性,此處使用第一行的表達式刻畫廠商1的推測,第二行刻畫廠商2); ar{c_{2}}ar{c_{1}}分別表示廠商1對廠商2生產成本的推測,以及廠商2對廠商1生產成本的推測。可以看到,每個廠商關於對方產量的推測取決於對方關於自己產量和成本的推測。

由於ar{ar{q_{1}}},ar{ar{q_{2}}}實際上也是不知道的,因此分析仍然應該繼續下去,直到無窮階。不過分析至此,我們已經可以很清楚得看到共同知識有什麼用了。例如我們假設邊際成本是共同知識,這便告訴我們

c_{1}=ar{c_{1}}=ar{ar{c_{1}}}=ar{ar{ar{c_{1}}}}=...\
c_{2}=ar{c_{2}}=ar{ar{c_{2}}}=ar{ar{ar{c_{2}}}}=...

帶回到之前的分析中,我們便可以把所有對成本的推測變成客觀知識了。又由於博弈實現均衡意味著參與者對產量的推測都是準確的,即

q_{1}=ar{q_{1}}=ar{ar{q_{1}}}=ar{ar{ar{q_{1}}}}=...\
q_{2}=ar{q_{2}}=ar{ar{q_{2}}}=ar{ar{ar{q_{2}}}}=...

經過化簡,我們直接得到了熟悉的古諾模型的求解方程組

q_{1}=(X-q_{2}-c_{1})/2\
q_{2}=(X-q_{1}-c_{2})/2

通常在計算博弈均衡時我們直接給出了上式方程組,跳過了中間所有的決策者思考過程,這種求解方式被Myerson稱為game-theoretical approach;類似上述從個人決策問題開始分析,利用所有條件一點一點獲得全局均衡的方式被稱為decision-analytic approach。正如我們看到的,採用後者的分析思路可以讓我們清晰地看到均衡是如何產生的,以及不同解的概念為什麼被需要。

順便提一句,匿名用戶的答案可能有些問題,並且對完全信息和非完全信息的分類也值得商榷。首先,完全信息均衡要求的共同知識大概分為兩部分:對模型設置的共同知識(收益、行動順序等等)和對理性的共同知識。這兩部分要求有不同的文獻進行防松,但是一個條件的防松必然帶來其他條件的收緊,但是直接說不需要共同知識是不準確的。第二,完全信息與不完全信息的區別僅僅存在在收益是否是共同知識上(Harsanyi論證了三種未知最終都可以反映在收益矩陣上)。而且,如果是利用Harsanyi game和BNE解的概念進行分析,那麼必然會需要Common Prior假設,即對於未知的先驗分布是共同知識。因此,也不是隨便只要未知就能稱為不完全信息博弈的。最後,嚴格的說確實存在不需要共同知識的博弈。例如前一陣見到Zamir,他說他理解的NE概念是(s_{1},s_{2},s_{3}...;phi _{1}, phi _{2},phi  _{3}...)其中每個策略s_{i}都是給定信念phi _{i}下的最優反應。在這個解的概念下,不一定需要共同知識來支持全部的高階信念phi _{i}。但是,正如之前所說的,共同知識和高階信念是理解博弈的兩條重要線索,如果你可以充分理解到這句話,就不用糾結於那條線索更有意義,因為在研究特定問題的時候你會形成自己的視角。而且,如果高階信念之間完全不相關的話,實際上博弈問題就退化成了單人決策問題:別的參與人都是你高階信念中的「道具」而已,大家各自腦中都有各自的故事。如果這種情形符合你的研究要求,那也未嘗不可,但是你需要設定無窮階的信念並說明為什麼這麼設置——聽起來就很麻煩且說服力有限。

最後在啰嗦一句,從認知博弈的角度來看,很多理論顯得更為清晰了。但是遺憾的是,國外對這個問題的討論主要集中在80年代和90年代,也就是說,我們大概落後了20年。不過這個領域仍然值得學習的一點在於,它幫助研究者了解在使用某個假設的時候我們究竟在刻畫什麼情形,這與實際情況是否相符。這一點我個人認為還是很重要的。


以下這篇paper應該是題主在找的了:

Epistemic condition for Nash equilibrium, Aumann Brandenburger 1995:

雙人博弈的納什均衡並不需要公共知識(common knowledge)。只要滿足如下條件:既payoff(收益),遊戲本身,以及知道彼此是理智的,並對對方的理性行為有正確推斷。

然而,大多數情況下,我們是在不確定對方接下來行動的時候進行博弈。這篇paper最重要的結論(theorem A)就是,mixed equilibrium的理解方式。不是player randomize their behavior,而是players form conjecture(uncertainty) over others action space. Both of them have such belief and best response to it. Therefore, we observe mixed strategy NE.

然後(theorem B)是說三人以上博弈的情況,我們需要的是每個人對於其餘所有player的conjecture (overall conjecture)是common knowledge, 收益與理性是mutual knowledge.然後形成納什均衡。

以及,以上條件都是充分非必要條件(如題)。意思就是在不滿足的情況下也可以形成NE.但所有以上條件都是tight的。就是說不可以放鬆一點點。


「共同知識」在納什均衡的假設中體現為:我知道你怎麼想,你知道我知道你怎麼想,我知道你知道我知道你怎麼想,。。。(無限循環嵌套下去)

這個假設的作用在於,每個人考慮針對對對手的最優策略時,還要考慮對手對我的對策的最優策略,然後還要考慮我對對手對我的對策的最優策略的最優策略,。。。(無限循環下去)。因此,最終的均衡策略就是最優策略函數(或correspondence)的不動點。

納什均衡的數學定義便是最優策略的不動點。

如果去掉這個共同知識,而只假設每個玩家是理性的,那麼對於一個博弈結果的預測只能精確到rationalizable strategies。


我來說點技術性的~關於如何理解信息函數和知識函數,以及共同知識和共有知識~

因為共同知識是通過知識函數定義的,知識函數又是通過信息函數定義的,所以下面的內容會從最基本的部分開始。

======什麼是事件======

給定一個基本事件空間Omega =left{ omega_{i}  
ight} ,我們知道所有的「事件」都是這個基本事件空間的子集,這些事件的集合就是Omega 的冪集P(Omega )。舉個例子,甲乙兩個人各扔一個六面體骰子(帶數字那種),那就有36種可能的結果,這每個結果都是一個基本事件。如果甲扔的數比乙扔的數大,那我們就說事件「甲贏」發生了。如果甲扔的數比乙大或者和乙一樣大,我們就說事件「甲沒輸」發生了。下圖中,每個格子對應一個基本事件,綠色對應事件「甲贏」,藍色對應事件「甲沒輸」。

如果是兩個人同時扔骰子並且一起觀察結果,那他們扔完就一定能知道誰贏了或者誰沒輸。但是,如果兩個人是在各自的電腦上用程序扔的,而這個程序暫時不返回遊戲的結果,那他們可能正確地猜出結果嗎?換句話說,他們有沒有可能在只看到自己的數字的時候,就斷定誰贏了或誰沒輸呢?

答案是可能。因為如果甲扔到了6,那他就會知道自己一定沒有輸,因為乙最多也就扔6並且和自己打成平手;而如果甲扔到1,那他就會知道自己一定沒戲贏了,因為乙不會扔的比自己還小。

但是,如果甲扔到了4,他就不可能知道自己一定輸了或贏了,因為此時他不知道的乙的數字決定了他的輸贏。下面用信息函數和知識函數來刻畫這個問題。

======什麼是信息函數======

定義一個信息函數P:Omega 
ightarrow P(Omega ),使每個基本事件對應於一個事件,這個事件可以是一些基本事件的並集。我們可以理解為如果基本事件omega 發生了,當事人可以知道事件P(omega )發生了,但是如果P(omega )包含多個基本事件,那麼他不知道發生的到底是裡面哪一個。比如,對於甲的知識函數有P_{1} (left{ (6,1) 
ight} )=left{ {(6,1),(6,2),(6,3),(6,4),(6,5),(6,6)} 
ight} 。這是說如果實際情況是甲扔了6且乙扔了1,因為甲只能知道自己的數字是6,他知道left{ (6,1) 
ight} ,left{ (6,2) 
ight},left{ (6,3) 
ight},left{ (6,4) 
ight} ,left{ (6,5) 
ight},left{ (6,6) 
ight}的其中一個發生了,但是不知道到底是哪一個。這就是書里所說「當omega 發生時,他只知道P(omega )發生了」。

書里還說,如果滿足兩個條件:omega in P(omega)omega^{prime} in P(omega)Rightarrow  omega in P(omega),那信息函數P誘導了基本事件空間Omega 上的一個劃分。這裡第一個條件其實是說,如果甲知道P(omega )(自己扔了6),那情況絕不會是他扔了5,因為(5,1)
otin P(Omega)。也就是說甲知道的信息不能是假的。第二個條件是說,如果甲扔了6,無論乙扔了1還是4,甲都知道自己扔了6而乙扔了某個數,因為(6,4)(6,1)都在P(omega )里——P(omega )在這裡成了一個等價類。

在圖中畫出這個問題,我們可以看到甲的信息函數誘導了綠色的劃分,把36格分成了互不相交但填滿所有格(此即劃分的定義)的6個豎條;而乙的信息函數則將其分成了6個橫條,對應於橙色的劃分。

======什麼是知識函數======

下一步,定義知識函數K(E)=left{ omegain Omega|P(omega)subseteq E 
ight} ,其中E為一個事件。這個知識函數是說,如果omega發生了,則當事人知道有個P(omega )中的omega發生了;因為P(omega )是E的一個子集,前者中有個omega發生一定意味著後者中有個omega發生,這時稱「在omega發生時知道事件E發生」。舉個例子,將上面第二和第三張圖疊加,得到

此時若(6,1)發生,則甲知道實際情況是橙色圈中的某一個,而且必定是藍色區域內的某一個,因此他知道事件「甲沒輸」發生了。

這裡在知識函數的定義中,P(omega)subseteq E的含義是什麼呢?請看,如果把第一和第三張圖疊加,有

因為右下角那個格不在E中,P(omega)subseteq E不成立。此時儘管甲知道橙色圈內某事件發生了,但是它不確定是上面5個裡的一個發生了還是最下面一個發生了。儘管他自己扔到了最大的6,但是有可能乙也扔到了6。因為甲不能排除這種可能性,他就會「不知道"甲贏"(一定)發生了」。注意我們說「知道」的意思是以100%的概率確信,這是個很強的要求。

類似,如果甲扔到了4,他既不能知道(確信)「甲沒輸」,也不能知道(確信)「甲贏」。理由如下:

======什麼是"共有知識"和"共同知識"======

最後討論一下什麼是共有知識(mutual knowledge)和共同知識(common knowledge)。現在假設甲扔到了6,乙扔到了1,即(6,1)發生了。顯然此時二人都知道「甲未輸」——甲知道乙不會比自己大,乙也知道自己不會比甲大,所以甲未輸。在圖中看是這樣的:

兩人的圈都落在藍色區域「甲未輸」以內。兩個人都知道(確信)某一事件發生,那這一事件即為共有知識(mutual knowledge)。

但是(6,1)發生會不會讓「甲未輸」成為共同知識(common knowledge)呢?共同知識是說,甲知道甲未輸,並且知道乙知道甲未輸,並且知道自己知道乙知道甲未輸……無窮循環。那麼看,我們之前在圖中表示了甲知道「甲未輸」(即讓橙色圈落在藍色區域內),現在如果把「乙知道甲未輸」當做一個新的事件,是否有類似的結果呢?

抱歉,木有。甲扔了6的時候知道自己沒輸,可是乙只有當扔到1的時候才知道自己沒輸。甲雖然自己扔了個大6,但他不知道(確定)乙有沒有扔到小1。萬一乙扔到4了呢?那時乙不可能知道「甲未輸」。因此,甲無法知道(確信)「乙知道甲未輸」,乙的情況也類似。因此,「甲未輸」在(6,1)不是一個共同知識(common knowledge)。

用圖來理解一下。上圖中的綠圈即是事件「乙知道甲未輸」:乙知道甲未輸當且僅當自己扔了個1。甲要想知道事件「乙知道甲未輸」,他就必須讓一個橙圈被完全套在綠圈裡面,比如一些只包含單個基本事件的橙圈。下圖表明這是不可能的。

這是我在地鐵上突然想到的例子,希望對大家理解數學背後的intuition有幫助~~~


詳見:

http://healy.econ.ohio-state.edu/aumannbrandenburger.pdf


納什均衡並不要求「公共知識」,缺乏公共知識也能形成納什均衡。

所有知識(收益,行動空間。。。)都是公共知識的博弈叫完全信息博弈,如有知識不是公共知識則為不完全信息博弈。


我知道你會怎麼想和我猜你會怎麼想是完全不同的


推薦閱讀:

購買商品,如何應對「等你什麼時候過來買,就沒有了」的狀況?
為什麼沒辦法讓自己的左手和右手猜拳?
假如未來人工智慧近乎完美,那麼掌權者能夠甘心放下手中的權力嗎?
如果博弈中只有唯一純策略納什均衡,是否意味著不存在(完全)混合策略均衡?
兩個有核國家交惡,一方怎樣判斷來自對方的導彈是否裝載了核彈頭?怎樣判斷是否需要在導彈落地前進行核反擊?

TAG:經濟學 | 博弈論 | 納什均衡NashEquilibrium | epistemicgametheory |