標籤:

關於羅伯特·奧曼的論文《不一致的達成》怎樣解讀?

能不能用比較清晰的說明方式來「翻譯」一遍這篇論文?網路上流傳的那個譯文真心看不懂,很多變數都不說明其代表什麼含義,就開始證明,本人英語又真心捉急,看不了原文。故求高人,不勝感激!


這個問題這麼好不知道為啥沒人答。

我是在 @yolfilm這篇專欄冤親債主 - 人間 - 知乎專欄 的一個留言中知道這篇文章的。留言是這麼說的:

「諾貝爾獎得主羅伯特·奧曼在1976年發表了一篇論文 《不一致的達成》,這篇堪稱傳世的論文說的是:如果是兩個理性而真誠的真理追求者爭論問題,爭論的結果必然是二人達成一致。換句話說如果爭論不歡而散,那麼必然有一方是虛偽的。」

這個太有意思了,和阿羅不可能定理同樣有意思,所以我一定要看看他的證明。

首先糾正一下這個定理的翻譯,上邊的翻譯非常淺顯直白,但是不能代表原文的含義,是個理想主義小清新的概括。我翻譯一下是這樣的:

「如果兩個人具有相同的先驗知識且他們的後驗知識是「共同知識」,即使他們的後驗知識一開始不同,也能夠通過爭論形成相同的後驗知識。」

這其實是博弈論,尤其不完全信息博弈中非常重要的問題。

我不知道樓主有沒有集合論的知識。我試著用通俗的語言回答一下吧。

這個問題的關鍵是,我們的後驗概率是在先驗概率的基礎之上按照貝葉斯法則更新的,所以後驗概率取決於兩個變數,一個是先驗概率,一個是實際發生的狀態。而共同知識使得這個實際發生的狀態在二者之間是相同的,所以最後的後驗概率當然也是相同的。

拿這篇文章舉的這個硬幣的例子。

(兩個人分別擲硬幣一次,要求預測下一次出現正面的概率。第一個人第一次出正面,第二個人第一次出反面。因此第一個人認為下次出正面的概率是三分之二,而第二個人則認為是三分之一。當他們經過對預測的交流之後,都把它修正為二分之一)

我不知道樓主是不是和我看的一個翻譯版本。這個版本的翻譯是有誤導的,uniform prior翻譯成了統一先驗知識,我認為這裡應該均勻分布的先驗知識。因此在這個例子中,先驗概率就是每一次硬幣出現正面的概率服從均勻分布,而後驗概率是在第一次出現正面或者反面的情況下,第二次出現正面的概率,這是一個重複2次的二項分布。容易計算當第一次出現正面時,後驗概率為三分之二,而第一次出現反面時,後驗概率為三分之一。

由此可見,同樣是均勻分布的先驗概率,由於第一次實際發生的狀態不同,後驗概率是不同的。你可以這樣理解,當我們不知道硬幣的質地時,我們會認為它出現正面的概率最穩妥的猜測是0到1的均勻分布,而當第一次它是正面的時候,在這個信息下,我們就提高了它下一次仍然是正面的預期,反之亦反。

共同知識是如何發揮作用的?假如這兩個人有了一個爭論,第一個人認為下一個硬幣是正面的可能性是三分之二,而第二個人認為是三分之一。由於先驗概率,硬幣出現的可能性都是共同知識,並且1知道2知道,2知道1知道2知道,……因此第一個人通過第二個人認為是三分之一,可以得知第二個人第一次是反面朝上,同理第二個人也知道第一個人的第一次是正面朝上,在這種情況下他們會修正實際發生的狀態,實際發生的狀態是進行了兩次擲硬幣,第一次正面第二次反面,因此下一枚硬幣出現正面的概率就被修正成二分之一了。

你可以這樣理解,當我得知了一個更傾向於下一次出現正面的信息時,對方也得知了一個更傾向於下一次出現反面的信息,當我們出現爭論的時候,我知道了對方有了一個和我相反的信息,我把這個信息納入我的決策重新考慮,於是修正了我的信息,我不那麼自信了,我做了一個更加保守的決策,從三分之二修正成了二分之一。

樓主對數學證明感興趣,我就說一下吧。

首先說一下這些符號。(按照這個翻譯版本不一致的達成_百度文庫)

歐米伽是狀態空間,也就是世界上每一種有可能發生的狀態的集合。T是狀態空間里的一個劃分。

例如狀態空間是(1,2,3,4)

一個劃分可以是(1)(2,3)(4)

也可以是(1)(2)(3,4)

(這個例子來自博弈論與經濟模型第13章)

P(w)是w這個狀態發生時一個劃分里的元素。這個相當於博弈論里的信息集,也就是w發生了之後,你能觀測到w,但是你知道認為這是P(w)里的一個狀態發生了,你不能確定它就是w。只有當P時單點集的時候,你才能確定知道是w發生了。

舉個例子,在第一個劃分中,2發生的時候,你只知道是(2,3)發生了,而在第二個劃分中,2發生了你能確定知道是2發生了。

舉個現實的例子,農產品產出受到氣候和努力程度的影響,當出現差收成的時候,你不知道實際發生的狀態是氣候較差還是努力程度不夠;而工業品產出只受到努力程度的影響,因此當出現差收成的時候,你確定實際發生的狀態就是努力程度不夠。

一個事件為E,我們用KE表示能夠知道E發生的狀態的集合。因此K(KE)就是知道知道E發生的狀態集合,而K2(K1E)就是參與人2知道參與人1知道E發生的狀態集合。

仍然以上述劃分為例子,令事件E=(3,4),令第一個劃分為參與人1的劃分,第二個劃分為參與人2的劃分。

我們看哪種狀態下參與人1可以知道E:當3發生的時候,參與人1隻知道P(3)=(2,3)發生了,不確定發生的究竟是2還是3,所以3發生時不可以,當4發生時,參與人知道是4發生了,所以4發生時可以,K1E=(4)。

同理看哪種狀態下參與人2可以知道E:當3發生時,參與人知道(3,4)發生了,這正是E,同理當4發生時參與人也知道(3,4),也就是E發生了,因此K2(E)=(3,4)。

差別在哪裡?差別在於參與人1對2,3難以分清,而參與2對3,4難以分清;但是E不需要對3,4分清(因為不管是3還是4,它總是發生),只需要對2,3分清(因為如果是2,它就不會發生),所以參與人2的知識更多一些。

那麼共同知識呢?注意,共同知識不但要求兩個參與人知道對方的一切信息,也就是不但要求1知道2知道,還要求2知道「1知道2知道」,還要求1知道2知道1知道2知道……也就是K(K(K(K)……))這樣無限嵌套下去。

仍然看這個例子,

先看參與人1知道不知道參與人2知道,由於K2(E)=(3,4),當4發生的時候,顯然參與人2知道,參與人1也知道4發生了,因此也知道參與人2知道,因此K1(K2(E))=(4)。

再來看看參與人2知道不知道參與1知道,由於K1E=(4),當4發生的時候,參與人1顯然知道,但是參與人2隻知道(3,4)發生了,假如發生的是4,當然參與人2知道參與人知道,但是假如發生的是3,對於參與人1來說,他只能知道是(2,3)發生了,然而如果是2發生,他顯然不知道E發生了,所以參與人2不知道參與人1知道不知道。

也就是說,在狀態4下,E的發生雖然是兩個參與人的「共有知識」,但不是兩個參與人的「共同知識」!!因為參與人2不知道參與人1知道E發生了。

再看一個事件F=(2,3,4),樓主可以自己證明一下,這個是共同知識。

什麼樣的狀態能夠產生共同知識呢?其實是兩個參與人的劃分中,其中一個參與人的劃分的元素並集,同時也是另一個參與人劃分的元素的並集,這樣的一個集合叫做「不證自明」的知識,當一個狀態包含在這個集合同時包含在事件發生中時,就能產生共同知識。

樓主可以證明事件(1,2,3,4)是所有狀態的共同知識,事件(1)是1的共同知識,然而事件(1,2,3)無法成為共同知識,因為參與人1 的劃分可以並出來,但是參與2不可以,當2出現時,參與人1不知道是2還是3,假如是3,參與人2就不知道。

了解了這些概念剩下的就是證明了。這個證明樓主可以自己看,其實道理就是已經說過的一句話:我們的後驗概率是在先驗概率的基礎之上按照貝葉斯法則更新的,所以後驗概率取決於兩個變數,一個是先驗概率,一個是實際發生的狀態。而共同知識使得這個實際發生的狀態在二者之間是相同的,所以最後的後驗概率當然也是相同的。

最後看一下那個渣翻譯:如果是兩個理性而真誠的真理追求者爭論問題,爭論的結果必然是二人達成一致。換句話說如果爭論不歡而散,那麼必然有一方是虛偽的。

這種情況成立其實有三個前提:第一,二人對真理的先驗認識是一致的(先驗概率相等);第二,二人對對方的知識體系和思維方式是了解的(了解對方的劃分);第三,當世界的某種狀態實現時,二人對伴隨而來的事件都知道,並且都知道對方知道,並且都知道對方知道對方知道……

這些條件非常苛刻。當然如果你加上「理性」而字。。在經濟學中,理性意味著完全信息,那麼理性的從一開始就是必然一致的,所以也沒什麼意義。


首先明確《不一致的達成》(agreeing to disagreement)一文中三個核心名詞的定義:先驗知識(prior),後驗知識(posteriori),和共同知識(common knowledge)。雖然哲學界對先驗(priori)與後驗(posteriori)確切定義一直爭論不休,但我相信在這篇文章的語境中,先驗(prior)指不需要經驗或者實證證據就可獲得的知識,具體地,是指可通過邏輯推理獲得的知識。而後驗(posteriori)則指代必須由經驗或者實證證據才能獲得的知識,是對經驗和證據的總結。共同知識(common knowledge),指所有人同時知道並同意的知識。

在這篇文章中,Aumann是在用數學的語言闡釋自己對「先驗」與「後驗」的關係的理解。簡言之,如果兩個人經由推理獲得的知識是相同的,而他們通過經驗和實證證據得到的知識又是共同知識,則兩人必然達成一致。換言之,「不一致的達成」是不可能發生的。

Aumann用扔硬幣的例子直觀解釋了這一觀點。假設我們擲一枚硬幣,那麼擲幣之後出現「頭」和「尾」的概率應該是相同的——即各50%。我們即便不扔硬幣,也會得到這個知識,所以「每次擲硬幣出現頭的概率為1/2」 就是先驗知識,不依賴於經驗而存在。假如A和B分別擲一次硬幣,A看到了」頭」,而B看到了「尾」,那麼基於這個經驗觀察和前述先驗知識,A的後驗知識是「擲硬幣三次有兩次頭(2/3)」,而B的後驗知識是「擲硬幣三次有一次頭(1/3)」——於是問題來了:A和B的後驗知識是不相同的。此時如果A和B都堅持自己是對的,便出現了不一致(disagree)。雖然擲硬幣出現頭的客觀概率為1/2,但二人的主觀概率(subjective probability)是不相同的。此時,Aumann認為之所以會出現這種後驗知識的分歧,是因為二人之間缺少共同知識(common knowledge)——他們都只能看到對方的後驗知識是什麼,卻無從得知對方是如何得到該後驗知識的。而如果希望二人達成一致,一個解決辦法就是互相告訴對方自己的後驗知識從何而來:A告訴B我只擲了一次,看到了頭;B告訴A我也只擲了一次,看到了尾。基於對對方經驗的了解,兩個人都會修正自已的後驗知識,從而得到新的後驗知識:擲幣四次會有兩次看到頭。而這個後驗知識於A,B兩人來說,一定是相同的。同樣的邏輯可以運用到其他更複雜的事件和語境里:如果先驗相同,而兩人得到後驗的證據又是共同知識,則兩人的後驗必然相同。

這應該是題主要的比較清晰簡單的「翻譯」吧。文章中純數學的部分想必寫成文字形式也會給大家造成困惑所以就這樣吧,更重要的是我沒受過數學方面的系統訓練所以臣妾做不到啊!有理解不對的地方請各方高手指正。


建議看看《A Course in Game Theory》Chapter 5。裡面給什麼叫Knowledge 什麼叫Common Knowledge包括題主所問的Can people agree to disagree都有嚴格的定義,技術上又比奧曼的paper簡單。

個人覺得對這篇文章最好不要看用自然語言寫的科普文,因為否則很容易就產生誤解。

這麼說吧:原文其實講的是:「player 1認為某事件發生的概率是P1,player 2認為發生的概率是P2」這件事是他們的Common knowledge,那麼P1=P2。

但是,「player 1和Player 2認為同一個事件發生的概率是不同的」這件事是可以成為Common knowledge的。(上面推薦的書的習題里有)。這個結論和科普文里的很不一樣。

PS:乍一看上面兩個命題很矛盾,但如果用數學語言寫出來就會發現其實沒什麼矛盾。


一直對這個問題挺感興趣的,也算是有過自己的一點研究。

同人於野對這個問題有一篇深入淺出的科普文章(真理追求者 ? 學而時嘻之), 我認為是把要點說到了。如果想要通過人際交往間的updating belief形成共同的意見,關鍵還是需要雙方都是「真理追求者」。用經濟學的表述方式就是,雙方的效用函數一樣(或更弱一點,至少是common knowledge)。

其實Aumann這個定理有一個非常反直覺的推論,即Milgrom和Stokey的No-trade theorem ( Milgrom, Paul; Stokey, Nancy (February 1982). "Information, trade and common knowledge". Journal of Economic Theory26 (1): 17–27). 這個定理說的是,在Aumann的框架下,均衡狀態的交易市場是不存在單純以追逐貨幣回報的投機性交易(speculation)的。為什麼呢?因為在這個框架下,雙方會通過對方在交易中所提出的offer和counteroffer 中,推算出對方的私有信息(private information)。這種情況下是沒有投機交易可以達成的,因為這時雙方的belief都能夠support市場里的價格了。

所以我們看到的所有市場交易都不是投機交易?這就是我認為反直覺的地方。當然這不是唯一可能的contrapositive。 也有人認為導致這個反直覺結果的因素是「非均衡市場」,「非common prior」, "noise traders"等等,這又是後話。

作為總結,我認為雖然Aumann的研究非常有趣(據說他本來是不想寫這篇文章的,因為他認為這只是把顯而易見的事情用過度數學化的語言表述了),但實際上信息的不對稱很多情況下並不是導致人們意見分歧的唯一原因。如果股票市場的參與者都是Aumann框架下的「真理追求者」,那麼我們觀察到的市場肯定比現實中平靜很多。但實際的市場是一個信息與利益交織的世界,人們不確定的不只是客觀世界的信息,還有其他市場參與者主觀世界裡的利益訴求。說回來,如果單純通過信息交流就能達成共識,那巴別塔早就建成了吧?


推薦閱讀:

關於博弈論闡述有哪些寫得好的書?
歷史上有哪些著名的煙霧彈?
在勝率50%的情況下,如果是否進行比賽可控,凈勝一場的幾率是否會無限增大?
因為了解博弈論,你在現實中生活中發現哪些「反常」的事情可以用博弈論解釋?
機器與人對弈圍棋,無法獲勝的瓶頸是什麼?

TAG:博弈論 |