如何對高微 mas collel(MWG) game theory 進行一個邏輯上的總結?

比如該書7、8,9章講的Game Theory。是個什麼樣的邏輯,先介紹基本概念,定義strategy,extensive form, normal form是因為什麼原因或者在什麼情況下引出了mixed strategies, 之後的best respond, NE, Baynesian NE, subgame perfect N.E, backward induction都是這麼個邏輯引出的?為了解決什麼問題。謝謝!


經濟學新手強答一個,如有謬誤,還請指摘。

第7章在內容上充當了一個引導作用,按順序包括1.博弈(game)的基本概念;2.展開形表示法(extensive form representation);3.引入博弈論中的一個核心概念:策略(strategy)。在此基礎上提供了一種新的表示法,即標準形(或策略形)表示法(normal (or strategic) form representation);4.混合策略(mixed strategy)。

首先出現的展開形表示法,也就是常見的博弈樹,看起來較為直觀,尤其在刻畫完美信息博弈(可通俗地理解成存在先後順序、對手之前的行動可被觀察到的博弈)。但是在刻畫不完美信息博弈(對手做了什麼你並不知道,比如同時博弈)時,儘管我們引入了信息集(information set)這一概念,但這種展開形表示法的確沒有那麼直觀了。

因此我們有了一種新的表示法,即標準形表示法(normal form)。在介紹這一方法前我們首先得區分行動(action)和策略的區別,初學者在理解策略時,經常無法拋棄這樣一個念頭:無法實現的行動怎麼可以是策略呢?

上圖這個使用拓展形表示的完美信息博弈,講的是家長帶孩子出門遊玩,孩子吵鬧,因此家長威脅孩子說要掉頭回去。四種可能結果的收益已經給出,前一個是孩子的收益,後一個是家長的收益。較為明顯的是,孩子因為先行動,因此只存在兩種策略,即要麼安靜,要麼繼續吵鬧。問題在於此時的家長,他的策略是什麼?我們說有四種:{x2=回家,x3=回家},{x2=回家,x3=遊玩},{x2=遊玩,x3=回家},{x2=遊玩,x3=遊玩}。策略和行動最大的不同是它是一套完整的行動方案,全名叫完整的相機行動方案(contingent plan)。這套行動方案無關乎孩子如何選擇,無論如何家長都有相應的策略去應對(正如策略這個名字一樣,比行動要更為宏觀),儘管在行動落實上,例如孩子如果先選擇了安靜,那麼x3時家長的行動方案自然就作廢了。

標準形用如下方式表示:

以上例子屬於完美信息博弈,家長在行動前是已經知道自己是在x2還是x3的,因此在行動上排除了某些可能性。但是如果現在有一個非完美信息博弈,例如同時博弈,那麼一套完整的策略作用就體現出來了。從直觀感受上說,展開形更適用於表示存在先後順序的完美信息博弈,標準形更適用於表示同時行動的非完美信息博弈(這也是為什麼第八章採用的都是標準形),儘管兩者仍然可以互相表示、互相轉化。

第七章的最後介紹了混合策略這一概念。這一問題在數學上解釋起來較為容易,但理解的難點在於難以想像一個玩家會遵循一個概率開展自己的行動。在這裡我們可以以Sun-Rain game為例:明天是晴天(或雨天)並不是一個確定的事件,因此我們可以把它理解成是上帝會遵循一個概率讓明天是晴天(或雨天)。這也為我們在思考這類問題時提供了一種思路,上帝(Player 2)混合策略的出發點或許並不是在描述上帝的行為,而是我們(Player 1)對上帝可能開展行動的一個信念(belief)。

另外,對於這一問題可以參看一下第六章 Choice Under Uncertainty,對於理解不確定性選擇確實會有幫助。

第8章名為同時行動博弈(Simultaneous-Move Games)首先,在只考慮純策略這一條件背景下,我們定義了優勢策略(dominant strategy)、嚴格優勢策略(strictly dominant strategy)、弱優勢策略(weakly dominant strategy)、劣勢策略(dominated strategy)、嚴格劣勢策略(strictly dominated strategy)和弱劣勢策略(weakly dominated strategy)。在有了這些定義的背景下,我們接下來進行的所有研究都是圍繞著博弈論的「解概念」。因為我們的目的並不是僅僅描述一個博弈,更重要的是預測這個博弈的最終結果。我們知道如果選手擁有嚴格優勢策略,那毋庸置疑會選擇它,但往往嚴格優勢策略並不存在。那麼,我們可以通過刪除嚴格劣勢策略,因為我們可以預期對手無論如何都不會選擇這一策略。但是一次刪除並不能得到唯一的結果,在共同知識的情況下,我們想進一步研究問題的方法是:重複刪除嚴格策略。值得注意的是,我們並無法根據理性原理排除弱劣勢策略。

現在考慮允許混合策略的情況,我們是可以把嚴格優勢策略和嚴格劣勢策略的基本定義直接推廣到包含混合策略的情形。在可混合策略的條件下,如何判斷一個純策略是否是劣勢的,我們在原來純策略方法的基礎之上有必要考慮是否任何混合策略都比那個劣勢的純策略要好。事實上有了這一條件,我們能夠刪除更多的嚴格劣勢策略,因為某個其他純策略的隨機組合很可能就比你那個劣勢的純策略要好。

講到這裡,可能上述方法並不能讓我們滿意,那麼是否有一種適用範圍廣,得到的結果好,至少能涵蓋上面我們能想到的所有理性化行為的博弈問題求解方法?這就是博弈論中使用最為廣泛的「解概念」——納什均衡(Nash equilibrium)。需要明確的是,納什均衡並無法保證得到的解是「完全正確」的,但它是一個必要條件。而後面章節的內容基本是圍繞納什均衡解做進一步的「精鍊」,以求排除更多在某些情境下「不切實際」的納什均衡。在還未涉及到動態博弈問題的情況下,本章中剩餘部分所介紹的貝葉斯納什均衡(Bayesian Nash equilibrium)便是基於不完全信息博弈(貝葉斯博弈)情況下,對納什均衡的一個精鍊。而本章的最後一個部分,顫抖的手完美納什均衡(trembling-hand perfect Nash equilibrium)則是基於存在小概率犯錯的可能性下,對納什均衡概念的一種精鍊。而第9章的內容便是圍繞動態博弈情境下,對納什均衡進行進一步的精鍊。


靜態完全/不完全,動態完全/不完全——對應NE PNE SPNE BPNE 四大均衡

然後再根據各個均衡的不足找其他均衡,比如PE CE


從基礎概念到靜態完全,靜態不完全。再到靜態與動態的不完全


推薦閱讀:

有哪些與博弈論相關的電影值得推薦?為什麼?
博弈論的簡明發展史是怎樣?
如何看待"遊戲是高智商人開發的,傻子在玩「這個觀點?
博弈論中的基本假設「共同知識」是怎樣體現在納什均衡的前提條件、推導過程以及結論中的?
購買商品,如何應對「等你什麼時候過來買,就沒有了」的狀況?

TAG:博弈論 | 微觀經濟學 |