是不是所有 2×2 博弈中,有兩個純策略納什均衡就一定有一個混合策略納什均衡?
第一,如何找過個策略納什均衡。第二,如題。第三,如果ab兩個玩家,只有兩個同時選擇正面時才能沒人得到1的好處,否則沒人能得到好處。就是除了(正,正)是(1,1)。(正,反),(反,正),(反,反)都是(0,0)。請問這個博弈中的,混合策略納什均衡是什麼?@董可人
答主提的這個博弈是一經典例子,恰好落在@Richard Xu 給的奇數定理中「幾乎所有」之外,只有兩個納什均衡(正,正)和(反,反)。這個問題已見過不止一次,乾脆直接寫個證明。
奇數定理可分步作更嚴格表述:首先,幾乎所有博弈都是准強(quasi-strong)的;其次,幾乎所有博弈都是正則(regular)的;再次,所有正則和准強的博弈都只有奇數個均衡;因此,幾乎所有博弈都只有奇數個均衡。這裡選用證明來自Harsanyi(1973),完全是幾何的思路,非常優美。由於答主懶惰,大部分地方只給證明概要,強烈建議照著原文做一次。答案以下部分按符號說明、幾何直覺和證明主體順序排列。結尾簡單提及其它證明思路。
首先是符號,都是博弈論教材和書籍中常用記法。記有限博弈中有位參與者,其中第位參與者策略空間是,是有限集。令第位參與者策略集中第個策略為,則是全體參與者的一組純策略。每個參與者以一定概率選取不同純策略稱為混合策略,我們記第位參與者在第個策略上賦予概率,則一組混合策略剖面可記為,其中代表第個參與者在上選取的概率分布。令代表參與者收益,則完整描述了有限博弈。
Harsanyi證明思路如下:首先,構造一個新博弈,其中。這是退化(degenerate)博弈,個體支付與他人決策無關,有唯一納什均衡。接著再構造一個博弈,其中支付函數。當時,這個博弈就是,有唯一均衡點;當時,這個博弈就是原博弈。當在上左右移動時,策略空間和確定納什均衡所需條件交出一組代數曲線。全體混合策略空間是緊凸集,故這組曲線在策略空間內可以取到起點和終點。不妨令處均衡為起點,因此處雅可比行列式大於,根據隱函數定理知這不可能是終點,故處必然還有一個均衡構成曲線起點。如果處,即原博弈,還有其它均衡,它必然是代數曲線上一支的解析延長。又此分支向另一端解析延長不可能交邊界點於處,故這個交點必然在處,而這意味著除了之前那個構成起點均衡,其它納什均衡必然成對出現。為得到以上證明需要准強和正則條件,所以接下來說明「幾乎所有博弈都准強」和「幾乎所有博弈都正則」即可。證明前者需要說明非准強博弈構成歐氏空間中緊凸集邊界,再用Sard定理即可證明後者,這就構成了完整證明。
接下來開始描述證明梗概。考慮博弈,一組策略構成納什均衡條件為對所有參與者,有。記個體在策略中賦予正概率的所有純策略集合為,稱支撐集。則上式可化簡為以下兩類條件:一是支撐集內部所有純策略收益相等,即對,有,二是支撐集內任一策略收益至少和不在支撐集中純策略收益一樣大,即對,有。如果這些不等式全是嚴格不等號,我們稱這一均衡是准強的。否則,我們稱這一均衡是極弱的(extra-weak)。
注意到當時,支撐集必然包含全體純策略,否則,不在支撐集中策略將給出給出收益。因此,當時,只需要第一個條件,再對概率做一點規定即可確保滿足條件的策略必然構成納什均衡,這等價於對任意參與者的第個策略,我們都有。注意到對任意是嚴格凹的,二階條件自動滿足。所以上式給出了納什均衡的必要條件。在此基礎上,利用事實,我們可進一步化簡均衡條件為如下形式:對任意參與者的第到第個策略,有。這裡有個等式約束,加上這個約束,共計個等式約束。再加上對任意和,這個不等式約束,這個約束共同給出了時一組均衡。
記,這是一維歐式子空間。令集體是全體滿足以上個等式約束的全體的集合,在非退化情形里,是一維代數射影。再令集合是具備以下特徵全體的集合:不僅滿足前個約束,還滿足後個不等式約束。這意味著給出了全體博弈的解。令是博弈全體均衡集合,根據前面分析,可證原文定理1:當時,;當時,。
我們現在定義正則。考慮對應,我們可以寫出其雅可比行列式:對任意個體的混合策略,。其中對任意,。對到之間,。考慮原博弈的一個均衡,如果,我們就稱均衡是正則的,否則就是非正則均衡。博弈是正則的,當且僅當它的所有均衡都是正則均衡,雅可比行列式大於。
作者接下來引入幾個代數幾何中的定理,這裡簡要敘述。首先是原文定理2:記是維歐氏空間中代數曲線上一段弧且,則可在或處解析延長。證明按或是否奇異點分類討論即可。非奇異點情形用隱函數定理馬上證出,奇異點情形用Puiseux定理構造收斂列即可。這一定理馬上導出關鍵引理:令是一代數曲線,是任意一點,則通過點的的弧永遠是偶數條(可能不存在)且成對出現。成對出現意指:它們是彼此的解析延長而不是任何其它弧的解析延長。原文定理3如下:記是代數曲線的弧且整體坐落在有非空內部的緊凸集內。不失一般性,假設是的邊界點,那麼根據定理2和代數曲線性質,我們總可以在處作足夠遠的解析延長,使交於邊界點。
回憶前面記號,恰是一緊凸集,我們記其邊界為,再記解集合與交於考慮,如果不是孤立點,那麼以下二點必居其一且僅居其一:是博弈的均衡;是博弈的均衡。我們分兩步證明這一點。首先,當時,所有均衡支集都包含所有策略,這意味著在內部。而這又意味著當時,納什均衡不可能是邊界點,故只有時均衡在邊界點上。當時,因不是孤立點,這意味著我們可以用一組序列去逼近。又由於Debreu證明了對應是上半連續的,故必然是一組均衡。再計算均衡處雅可比行列式可知,故這是非奇異點,僅是代數曲線上一個分支的終點,以上證畢定理4和5。
命題6要求我們證明如果博弈是准強且正則的,則,即博弈處任意一個均衡都是非奇異點,且僅是代數曲線上一個分支的終點。令這個均衡是,如果在內部,直接使用定理5證法即證。如果不是這樣,說明部分純策略不在支撐集中。證明此命題等價於說明對任意不在支集中的策略,有。不失一般性,我們首先假設(1),再將兩邊對微分,再令,馬上得到(2)。注意到因為策略不在支撐集中,又博弈是准強的,這意味著(3)。結合(1)(2)(3)就得到了,證畢。至此,我們已準備好了一切工具。
現在即可證明核心命題:令是一準強且正則博弈,則至多只有有限個納什均衡。在處存在唯一突出均衡(distinguished equilibrium)與對應博弈在處唯一均衡相互連接。其它所有均衡均成對出現,彼此相互連接。因此,任一準強且正則均衡必然有奇數個均衡。我們首先證明有限性。回憶最開始的定義:代數射影和緊凸集的重合部分。這意味著至多只有有限個分支。又的均衡必然坐落在某個分支終點上。分支數量有限,結合一個分支至多只有兩個端點,有限性證畢。再考慮博弈在處唯一均衡,由於這個均衡是中一個分支的非奇異邊界點,這個分支必然可以延伸到處。否則,這個分支另一邊界點是自身,矛盾。不妨記處邊界點是,這就找到了前述突出均衡,第二部分證畢。假設處還有其它均衡,它們都是非奇異邊界點,恰好在一個分支上。由定理5可知它們不能延伸到自身和突出均衡處,由定理4和前述分析知它們不能延伸至處,故其只能成對出現,證畢。
接下來只需要證明以下兩個命題:全體非准強博弈構成零測集;全體非正則博弈構成零測集。這裡思路簡單,符號繁瑣,只給概要。為證明前一命題,只要看到非准強意味著確定納什均衡條件中部分不等式取等號,而這意味著全體非准強博弈構成歐氏空間中一內部非空緊凸集合的邊界,必定是零測集。後一命題需要Sard定理:如果映射「足夠」連續可微,定義域中雅可比行列式為0點的像構成0測集。重排策略後構造映射再用Sard定理即證。綜合以上所有命題,我們即可得到 @Richard Xu回答的奇數定理:幾乎所有有限博弈都只有奇數個納什均衡。
這個定理最早由Wilson在1971給出,證明用單純形法,也很優美。不過自己覺得無論是優美程度還是幾何直覺,都屬Harsanyi證明更優,故介紹這個版本。再次強烈推薦閱讀原文。
參考文獻:
Harsanyi J. Oddness of the number of equilibrium points: a new proof[J]. International Journal of Game Theory, 1973, 2(1): 235-250.
Wilson R. Computing equilibria of n-person games[J]. SIAM Journal on Applied Mathematics, 1971, 21(1): 80-87.奇數定理:幾乎所有有限策略博弈都有奇數個納什均衡。
從我有限的科普級知識來看 顯然大家趨向於選一【前提是我選一併不付出額外代價】如果雙方信息不能互通 並假設兩人理性 無額外成本 那麼一是最佳選擇 因為在對方選一時【共贏】在對方選二時【我也不虧】
那麼我選一就是最佳 不管對方選什麼 而且根據我的分析 對方必然選一
然後 因為兩邊的選擇與後果是對稱的 那麼大概就會有奇數個均衡解吧【並不是很清楚這個在兩邊的選擇不對稱是是否能證】最後 題主你有字打錯了 【每人】打成了【沒人】僅答第三問。
兩個參與者在進行決策時。均會考慮到選正的收益上限為1,收益下限為0;選反的收益上限為0,收益下限為0,所以兩個參與者均會選擇正。
混合策略納什均衡就是加上一個概率算一下,結果是一樣的。這個問題中ms和ps相同,都是正正,ms寫出來是(1*正,1*正),ps是(正,正)
正好在學博弈論,初學者,強答一個吧第一問找納什均衡最通俗的辦法就是:猜對手的策略,然後針對自己的猜測找佔優策略,對其他所有player採取這個方法,最後得出解,但前提是猜測正確
檢驗起來也不複雜,要用數學符號表示可能會非常複雜,用文字也可以描述,我用自己的話概括了一下:
1你們都這麼玩,誰不這麼玩就傻逼了,不信自己試2咱們都這麼玩,對大家都好2這麼玩結果最好,再給我一次機會選,我也不換但是這些辦法仍然有一定局限性,解決簡單問題還是適用的第二問 是的第三問 正,正;反,反所有純策略其實都是混合策略推薦閱讀:
※數學哪些分支的發展受益於物理,物理能夠長期為數學提供動力嗎,相對純粹的數學領域是否不與物理相互作用?
※代數幾何是什麼樣的幾何?
※上同調群在物理學中有哪些應用?
※Kahler幾何的發展歷程及其背景意義是什麼
※復幾何的前景如何?
TAG:數學 | 經濟學 | 博弈論 | 納什均衡NashEquilibrium | 代數幾何 |