經濟學裡的博弈論基本知識點有哪些?


經濟學是一門研究理性人假設下資源如何配置的學科。那麼我們在對經濟現象建模的時候要回答以下幾個問題:

1.涉及哪些參與者

2.他們可選的方案有哪些

3.給定理性人的假設,他們會如何決策,結果如何

4.他們的福利如何。

所有這些問題正好可以用博弈論來建模,比如

1.經濟現象所涉及的人正好對應於博弈論中的players

2.可行方案對應於strategies

3.如何選擇和結果如何正好對應於各種解概念(solution concepts),比如大家熟悉的納什均衡。博弈論最重要的其實就是各種各樣的解概念。為何我們要提出這麼多解概念呢,因為在許多情況下人們的決策往往依賴於他人的決策,而不是中級微觀里解個約束條件最優化那麼簡單。

4.福利正好對應於payoff

具體來說的話微觀經濟領域幾乎每個分支都要應用博弈論的知識(宏觀我不太了解,但前沿的動態契約理論也會用到)。微觀大致有那麼幾個分支吧

1.產業組織(IO):最基本的古諾模型,就用到了Nash Equilibrium。Stakelberg 模型用到了Subgame perfect equilibrium。

2.信息經濟學:Spence教育模型就是一個不完全信息動態博弈,用的解概念是perfect Bayesian equilibrium。

3.拍賣:一級密封拍賣的均衡就是個Bayesian equilibrium。

4.匹配理論:這類模型的建模基本是不同於以上,用的是合作博弈里的解概念,比如說Core,stable matching。

暫時就回答那麼多了吧,具體的還得看書。推薦一本《A course in game theory》。(這本太難的話可以看看MWG的part3。基本都是博弈論在經濟學裡的應用)。


1、在博弈論中,完美信息和完全信息是兩個不同的概念。

完美信息(perfect information)是指,一個參與人對其他參與人(包括自然)的行動選擇有準確了解的情況,即每個信息集里只包含一個值。

完全信息(complete information)是指,自然不首先行動或自然的初始行動被所有參與人知道,即沒有事前的不確定性。

2、共同知識(common knowledge)是指,所有參與人知道的知識。

比如,在房地產開發博弈中,每個參與人的行動集合(開發,不開放)都是共同知識。

3、一致信念(concordant belief)是指,所有參與人共同享有某種知識,某個參與人可能不知道其他參與人知道這些知識,或其他人並不知道自己擁有這些知識。

比如,在房地產開發博弈中,可能A和B都知道市場需求,但A並不知道B是否知道市場需求。

4、戰略,它規定了參與人在什麼時候選擇什麼行動。信息集包含了一個參與人有關其他參與人之前行動的知識,戰略告訴其他參與人如何對其他參與人的行動作出反應,戰略是參與人的相機行動方案(contingent action plan)。

一般地,用si表示第i個參與人的一個特定戰略,si={si}表示第i個參與人所有可選擇的戰略集合(strategy set)。

5、一般用ui表示第i個參與人的支付(效用水平),u=(u1,u2,u3,...,un)為n個參與人的支付組合(payoff profile)。

博弈的一個基本特徵是一個參與人的支付不僅取決於自己的戰略選擇,也取決於所有其他參與人的戰略選擇,因而ui是所有參與人的戰略選擇的函數:

ui=ui(s1,s2,s3,...,sn)。

在房地產開發博弈中,如果A和B同時行動,

UA(高需求,開發,開發)=UB(高需求,開發,開發)=4000;

UA(低需求,開發,開發)=UB(低需求,開發,開發)=-3000;

那麼假定A認為高需求的概率為0.5,給定B選擇開發,則A選擇開發的期望效用為:

Eua(開發,開發)=0.5*4000+0.5*(-3000)=500;

6、均衡(equilibrium)是指,所有參與人的最優戰略組合。

一般記為,s*=(s1*,s2*,s3*,...,sn*)。

記S-i=(S1,S2,S3,...,Si-1,Si+1,...,Sn),即除了i以外的所有參與人的戰略組成的向量。

則,Ui(Si*,S-i)&>=Ui(Si",S-i) 任意Si"不等於Si*

這個定義是所有均衡概念的共同特徵。

7、在一般均衡理論里,均衡指的是由個人最優化行為導致的一組價格;在博弈論里,均衡是指所有個人的最優的戰略組合,最優價格是這種戰略組合產生的結果。

8、注意區分均衡和均衡結果。

比如,在房地產博弈中,假定B先選擇A後選擇,如果需求小,那麼均衡是({不開發,開發},開發),均衡結果是(不開發,開發)。

所以均衡結果里的不開發是A的最優行動,而不是A的最優戰略。

9、博弈一般兩種表述方式,一種是戰略式表述(strategic form representation),一種是擴展式表述(extensive form representation)。

戰略式表述適合於靜態博弈,擴展式表述適合於動態博弈。

10、有限博弈是指,第一、參與人的個數是有限的;第二、每個參與人可以選擇的戰略是有限的。


首先謝邀!

一. 博弈論概述

博弈論(Came theory)又稱對策論、遊戲理論或策略運籌學。它最早由德國數學家,哲學家萊布尼茲於1710年提出。1713年,傑姆斯·瓦爾德格雷夫首次提出了對策論中的極大中的極小(minimax)。然而,直到1944年,以馮·諾依曼和奧斯卡·摩根斯坦合著《博弈論與經濟行為》一書的出版為標誌,博弈論才得以廣泛應用於經濟學領域,並成為微觀經濟學的一個新的重要組成部分。

博弈是指一些個人、團隊或組織,面對一定的環境條件,在一定的規則下,同時或先後,一次或多次,從各自允許選擇的行為或策略中進行選擇並加以實施,各自從中取得相應結果的過程。


博弈論就是描述在這種形勢下各方理性地選擇自己的行動所實現的結果,分析各決策主體的行為發生相互作用時的決策以及這種決策的均衡問題。

二.博弈論三要素,信息及博弈均衡

(1)局中人(player:指參加博弈的各個決策個體,既可以是自然人,也可以是團體。局中人都是「理性」的,即他清楚地了解自己的目標或利益所在,在決策時考慮自己的知識(信息)以及對其他局中人策略的期望,總是採取最佳行動(或策略)以實現其支付的最大化。

虛擬局中人:自然,是外部隨機變數,對所有利益主體都無差異。

(2)行動與策略(
actions or strategies)
。行動是局中人在博弈的某個時點的決策變數;每一個局中人的所有可能選擇的行動的集合稱這該局中人的行動空間(action space);所有局中人的行動的一個有序集合稱為該博弈的一個行動組合(action profile); 策略是局中人在所有給定信息集(信息集是局中人在特定時刻進行決策時所面對的集合)下的行動規則,他規定局中人在什麼時候選擇什麼行動。

策略和行動不是等同的,它是行動的規則而不是行動本身,策略必須具有完備 性,即一個策略是關於行動的一個完整計劃——它明確了局中人在每一種可能情況下 對可行動的選擇;一個局中人所有可能策略的集合稱為該局中人的策略空間(stratgy space),所有局中人策略的一個有序集合稱為博弈的一個策略組合(strategy profile。Si={si}
S=(s1,s2,…si …sn) 如果一個策略規定局中人在每一個給定信息的情況下,選擇一種特定的行動,則這個策略稱為純策略(pure strategies。相反,如果一個策略規定局中人在每一個給定信息的情況下,以某種概率分布隨機地選擇不同的行動,則這種策略稱為混合策略(mixed strategies)。

(3)支付(pay off:指在一個特定的策略組合下,局中人得到的效用水平或期望效用水平。一個局中人的支付是所有局中人的策略選擇的函數,它不僅取決於自己的策略選擇,而且還取決於(他所設想的)所有其他局中人的策略選擇,任何一個局中人改變自己的策略都將影響其他局中人的支付水平,即,局中人之間的利益是相互牽制的和制約的。所有局中人的支付的一個有序集合稱為博弈的一個支付組合(payoff profile。

Ui=Ui(s1,s2,…si …sn)

參與博弈的多個局中人的收益可用一個矩陣或框圖表示,這種矩陣或框圖叫做收益矩陣。

(4)信息(information:是局中人有關博弈的知識,特別是有關其他局中人的特徵(如策略空間、支付函數等等)和行動的知識。信息集(information sets)是局中人在特定時刻進行決策時,所面對的信息變數值的集合。共同知識(common knowledge)是指「所有局中人知道,所有局中人知道所有局人知道,……」(或信息)。如果局中人的策略選擇、支付函數等都是共同知識,則稱之為完全信息(complete information ),否則就是不完全信息(incomplete information )

(5)博弈均衡(games
equilibrium
:是指所有局中人的最優策略組合。這裡所講的均衡與一般均衡是有區別的,前者是局中人的最優策略組合,即局中人之間的衝突與合作達到一種相對穩定的狀態;而後者則是這種策略組合所產生的結果。從某種程度上講是「均衡」和「均衡結果」的關係。前者是一種動態概念,後者是一種靜態概念。與純策略相對應的均衡是純策略均衡,與混合策略相對應的均衡是混合策略均衡。

三.博弈的類型

①根據博弈者選擇的策略,博弈論可劃分為合作博弈與非合作博弈納什(Nash)、澤爾騰(Selten)和豪爾紹尼(Harsanyi)(1994諾貝爾經濟學獎獲得者)的主要貢獻在於非合作博弈方面,而且現在大多數經濟學家論及博弈時,也主要是指非合作博弈。

合作博弈和非合作博弈的區別在於人們的行動為相互作用時,當事人能否達成一個具有約束力(binding agreement)的協議。若有,就是合作博弈;否則就是非合作博弈。

合作博弈強調的是團體理性、效率、公正和公平。非合作博弈強調的是個人理性、個人最優決策,其結果可能是有效率的,也可能是無效率的。

②從局中人行動的先後順序可劃分為靜態博弈(Static
game)和動態博弈(dynamic game
。靜態博弈是指在博弈中,局中人同時選擇行動或雖非同時行動但後行動者並不知道先行動者採取了什麼具體行動。動態博弈是指局中人的行動有先後順序,且後行動者能夠觀察到先行動者所選擇的行動。

③從局中人是否具有有關其他參與人(對手)的特徵、策略空間及支付函數方面的知識的角度,可劃分為完全信息博弈(game of complete information)和不完全信息博弈(game of
incomplete information)。

此外,根據支付結構不同:常和與變和博弈。

特徵

完全信息

不完全信息

納什均衡

納什(1950,1951)

貝葉斯納什均衡

豪爾紹尼(1967,1968)

動態

子博弈精練納什均衡

澤爾騰(1965)

精練貝葉斯納什均衡

澤爾騰(1975)

克瑞普斯和威爾遜(1982)

四.博弈表達的方式

策略式與拓展式


經濟學專業學生前來答題。

這篇回答講粗略地介紹博弈論中最基本的幾個要素和知識點,然後以囚徒困境和性別大戰作為例子去理解這幾個知識點。

1. 基本知識點

(1) 正則形式博弈三要素

a. 參與者(player)

b. 策略(strategy)

c. 收益 (utility)

可以簡單地說,有了這三樣東西,就可以構成最基本的博弈模型。

(2) 策略的分類

在博弈論中,策略分為兩類,分別是

a. 純策略 (pure strategy)

純策略存在優勢策略(dominating stategy)和劣勢策略 (dominated strategy)

b. 混合策略 (mixed strategy)

只要討論到混合策略,就必須明白一個知識點那就是self-forcing certainty,讀者可以講這個東西理解為一種 「選擇純策略的概率」。

(3)納什均衡 (Nash Equilibrium)

用大白話來解釋納什均衡,就是每一個參與者選擇的策略,都能給他們帶來最高的收益。並且這些策略集中在一個策略集合里(stragegy profile)。這個策略集合就叫做納什均衡。

(4)收益方程 (utility function)

收益方程就是說對於每一個純策略,當參與者根據對對手選擇策略的可能性(probability)的猜測,所得到的相關方程。

2. 囚徒困境

對於這種模型,有一個非常出名並且典型的例子,就是囚徒困境。

首先用簡單的話來描述一下這個例子,就是說有兩個囚犯被警察抓了,警察對這兩個囚犯進行分別單獨的審訊。兩個囚犯很清楚,如果他倆都保持沉默(quiet),他們兩人都會得到2的收益,如果他兩都認罪(fink),他們兩人只能得到1的收益。如果其中一個囚犯認罪,另一個保持沉默,那麼認罪的那個可以得到3的收益,保持沉默的得到0的收益。

現在,我們可以構造一個這樣的圖形出來了:

這個策略里的參與者分別是囚犯1 (prosioner 1 )和囚犯2 (prisioner 2),囚犯1的策略分別是quiet 和 fink,囚犯2的策略分別是quiet 和 fink,收益是表格中的數字(比如囚犯1選擇quiet,囚犯2選擇fink,囚犯1可以得到0的收益,囚犯2可以得到3的收益)

那麼,如果你是其中的一個囚犯,你該作何選擇呢?

很簡單,假如你是囚犯1,當囚犯2選擇quiet的時候,你應該選擇fink,為什麼?因為你選擇fink你可以得到3的收益啊,你選擇quiet只能得到2的收益啊,傻逼都會選啊,你必須選fink對不?但是囚犯2也不可能只選擇quiet啊,他萬一選擇fink呢?那你也要選fink,為什麼?因為你選擇fink可以得到1的收益,你選擇quiet只能得到0的收益,傻逼都會選啊,你必須選fink對不?

也就是說,無論囚犯2怎麼選,你都必須選擇fink!這個fink就是優勢純策略(dominating strategy),相反,quiet對你來說就是劣勢純策略(dominated strategy)。

同理,如果你是囚犯2,無論囚犯1作何選擇,你也應該選擇fink。

所以說,無論是囚犯1還是囚犯2,他們都要選擇fink,這個博弈的結果最後就是(fink, fink)或者說((0,1) (0,1))這個點,就是傳說中的納什均衡。說得更細緻一點,這個點是純策略納什均衡。

3. 性別大戰

性別大戰也是一個很典型的博弈模型(省去白話描述)

我們看這個博弈,如果你是男的,你怎麼選純策略,選不了!你看,當女的想fight的時候,你應該選擇fight,因為你選擇fight可以得到2的收益,高於你選擇Ballet0的收益;當女的選擇ballet的時候,你應該選擇ballet,因為你選擇ballet可以得到1的收益,高於你選擇fight0的收益。、

也就是說,這個博弈本身不存在優勢純策略,也可以說這個博弈不存在純策略納什均衡。

但是策略不止一種對不?之前講過,還有一種叫做混合式策略。什麼是混合式策略呢?

假如你是男的,你可以去猜啊,猜啥?猜女的選擇fight的可能性是x,選擇ballet的可能性是1-x。這就是self-forcing certainty。這種情況下,你根本沒有辦法直接定義你選擇fight或ballet所獲得的收益了對吧?那就不得不用到之前提到的收益方程,很簡單:

當你選擇fight的時候,你獲得的收益就是2x+0(1-x) = 2x

當你選擇ballet的時候,你獲得的收益就是0x+1(1-x) =1-x

讓它們相等,你可以得到x值為1/3,1-x值就是2/3。也就是說,如果你要讓你選擇fight和ballet的收益相等的話,女聲選擇fight的概率是1/3選擇ballet的概率是2/3。

同理,對於女生來說,男生選擇fight的概率是1/3,選擇ballet的概率是2/3

所以說,這個博弈的混合式策略均衡就是

((1/3, 2/3) (1/3, 2/3))在第一個小括弧里,那個1/3表示男生選擇fight的概率為1/3,那個2/3表示男生選擇ballet的概率為2/3;在第二個小括弧里,那個1/3表示女聲選擇fight的概率為1/3,那個2/3表示女聲選擇ballet的概率為2/3。

註:這篇回答只涉及了博弈論中最簡單的正則式博弈(normal form game)中最典型也是相對比較簡單的例子。


players,strategies,equilibriums, payoffs,information


推薦閱讀:

能否從博弈論角度來解釋生活中的商業聚集現象?
博弈論未來的主戰場是什麼?
博弈論取石子兒問題?
納什的「一鎚子博弈」案例中,為什麼實驗和理論的結論存在差異?該如何理解?
「大富翁」中,資產劣勢的多名玩家可否通過結盟免路費的方式來逆襲資產最強的玩家?

TAG:博弈論 | 經濟學常識 |