標籤:

猜數字遊戲的最佳策略是什麼?

從1-200之間,一共有200個整數。現在請你選一個數字(必須是整數)。我會把所有人選擇的數字做一個算術平均,誰的數字和這個算術平均值的2/3最接近,那麼誰就獲勝。


第一步:就算所有人都選200,最後的獲勝數字也只有133,因此沒人會選擇大於133的數字。

第二步:就算所有人都選擇133,最後的獲勝數字只有88,沒人會選擇大於88的數字。

第三步:59

重複上述步驟,唯一理性的結果就是所有人都選1


這題目我認為無解,因為缺了兩個至關重要的條件:參與的人數以及參與者的理性程度。

如果是跟大約10個普普通通的人玩這個遊戲,大概寫個35左右的數字勝算會比較大。

如果是跟2萬個足夠理智的人玩,顯然應該是寫0。


文| 狐兜兜

昨天,柴柴發布了一個猜數字遊戲的博弈論實驗(Sina Visitor System,猜中位數),得到了廣大柴油的熱情參與和好評,回復很火~ 同時,柴柴也通過後台數據,得到了很多有趣的結果~

下面,柴柴就來科普一下這個著名的遊戲,並解讀一下昨天的實驗結果~

背景簡介

這個遊戲的改編1981年 Alain Ledoux 發表在法國雜誌 Jeux et Stratégie 的著名博弈論遊戲 「guess 2/3 of the average-game」 ,猜平均數的三分之二。啟發自1936年經濟學家 John

Keynes 在其著作 《The General Theory of Employment, Interest and Money》 提出的概念 「Keynesian beauty contest」 ,目的是解釋市場中的價格波動

遊戲思想

「猜三分之二」遊戲不存在一個嚴格的必勝策略,然而存在一個納什均衡(非合作博弈均衡點。假設所有人信息不互通,都是絕對理性的,並且知道其它所有人都是絕對理性的)。事實上,其納什均衡收斂到0和1之間,因此最理性的方式是猜測0或1。(我們之後會對此進行分析)

然而問題是,現實世界不是一個絕對理性的世界,在各種進行這個遊戲的博弈論課程中,甚至經濟學博士的課堂也少有猜測結果為0的情形。

現在我們來思考一下原版遊戲(猜測均值的三分之二)的純理性思考脈絡(並且假設有足夠龐大的猜數字群體):

第1層,我們選擇的數字必然應該小於 100	imes frac{2}{3} (除了自己以外其他人均選擇100的情形)

第2層,如果其他人都想到了第一層,那麼我們選擇的最大數字應不超過 100	imes (frac{2}{3})^2

……

依次類推,思考到第 n 層結果為 100	imes (frac{2}{3})^n ,最終必然會得到一個收斂到一個無限接近於0的數字。得到的最終結果的的數值,就是群眾思考的層數。一定程度而言,這個指數代表了讀者受眾的理性程度。最終結果的數值越小,說明受眾越理性

這很類似在市場中定價的競爭策略。一方面要保證自己的定價足夠高有利潤讓自己賺取,另一方面定價要相對其它商家足夠低廉來吸引顧客。因此需要猜測自己的同行們的普遍的定價心理。

以往結果:

多個著名媒體曾經進行過較大規模的「猜三分之二遊戲」的統計:

1987年《金融時報》最終的結果為13;

2005年丹麥雜誌《Politiken》在有19196名讀者參與的情形下最終的結果是22.2;

耶魯大學博弈論公開課中,結果是10左右。

……

可見,這類遊戲的參與方法,除了自己足夠理性之外,還需要猜測與自己競爭群體的理性程度。

柴柴的遊戲

回到我們的遊戲上來,我們的目的是猜測所有人中位數。這個遊戲是否有必勝的純粹理性的必勝策略呢?

不一定。

情況一:如果考慮人們可以進行信息溝通與交流。此時就不再是「納什均衡」而是另一個均衡,稱為「協均衡」(Correlated Equilibrium)。在這裡,協均衡的平衡點可以是0到100中任意一個數(事實上評論區下不少柴油們也是打算這麼做的)。你看,只要有一個很厲害的傢伙發話:大家一起選xxx,並且大家一呼百應,那麼最終就是選xxx的都獲得了兩百塊RMB的分成~

情況二:如果禁止信息溝通呢?那就又回到了納什均衡的情形。不同於之前的「猜三分之二」問題,這裡不存在一個上限來進行限制,但我們也採用類似地方式來推理:

第0層,大家都不思考,數值隨機分布,其中位數為50的可能性最大。

第1層,如果每個人都考量到第0層,那麼選取的數值更加向50集中。

……

此後的迭代愈發簡單, 就是不斷向50集中。

那麼,是否選擇50就是最佳的策略呢?

還是~不一定的!

首先,柴柴的讀者具備各種不同的思考層次,不能用簡單的「純粹理性」假設來判斷;其次,我們的推斷是建立在「概率」的基礎上,如果樣本小的話會導致隨機性極大;再其次,各種因素的干擾,導致猜測50之上與50之下選擇的比例並不是對等的;再再其次,柴柴評論區肥腸自由,處在一個「納什均衡」和「協均衡」混雜情況下(既有試圖引導大家的「領袖」,也有大批的吃瓜群眾)。

所以,雖然看起來柴柴的遊戲比原版更簡單直接,但是實際上卻蘊含了很多不同的趣味呢!

結果分析

最終的結果是49,柴柴基於數據進行了一些統計,得到了一些有趣的結論!

我們的微博最早發佈於9:30,而到了10:50的時候,中位數就已經實現了到49的收斂,可見群眾的智慧在很快的時間內就發生了效用呢~

下圖就是在收斂之前,所有數字中位數的變化趨勢圖,是從下方到達上方的收斂:

49,已經是一個距離50很近的數字了,那麼是不是就是很接近完美了呢?

並~不~是!

請各位讀者觀察各個數字的頻率分布圖:

我們很容易注意到,50次被大家選擇的次數遙遙領先,但是,在50的左右,卻出現了明顯的不平均的現象,小於50的情況遠遠多於大於50的情況。

事實上,選擇數字小於50的次數為1120次,大於50的次數為769次,比例接近1.5倍,可以算是相當巨大了。此外,所有數字的平均值為44.8,也比50有不小的距離。

這就出現了一個疑問:為什麼會出現小於50的傾向呢

柴柴猜測,可能是在這個遊戲的過程中,不少柴柴的讀者曾接觸過這類遊戲,因此大腦中有關於此前此類遊戲的模糊印象,「似乎最優解是0或者1的樣子」,於是就造成了一個整體偏小的趨勢。

思考題:

讀者們有沒有發現數據中出現了怎樣的奇異現象?在頻率分布圖上,各個數字的選擇次數,在50左側居然呈現出非常類似光子單縫衍射強度的圖樣(如下圖),這是否是一個巧合呢?

(對此現象,柴柴也只是注意到了,卻沒有答案,這似乎是一個很有意思的問題呢,請大家踴躍留言討論~)

另外廣告一句:

柴柴的知乎號元氣滿滿地要開動了,歡迎大家多多關注多多點贊~


我的題目是在0 -100 的範圍,選擇一個數字,這個數字等於大家選擇數字平均值的2/3。

分析一下: 1-100的期望值是50。

極端情況,如果大家都選擇100,那麼最大數字是66,所以66 -100 的數字是無論如何不可能是答案的。

如果大家都隨機選擇,那麼平均值是50,你要選擇的是50 * 2/3 = 33。

如果大家都選擇33, 那麼你要選的是33 * 2/3 = 22。

如果大家都選擇22, 那麼你要選的是 22 * 2/3 = 15。

遊戲可以一直玩下去,直到 1。

這個遊戲我玩了10年了,在不同的公司給不同的人群玩過。 一般答案都是在20 -25 之間。如果群體平均智商比較高,那麼會小於20,如果智商堪憂,會在25 - 30 間。

為什麼?? 為什麼不會是1 ?

因為不是所有的人非常聰明,也不是所有的人都非常笨(隨機選擇)。絕大多數人,會想到 50 *2/3, 這時候你要做的是,比絕大多數人多想一步: 50 * 2/3 * 2/3 = 22。

這個結論很有現實意義:

在這個社會你沒必要考慮很多,考慮的太多的人患得患失,會失敗(在遊戲中選擇數字1 的人。在現實中,比如有錢不買房子的 「極端理智「的人。你總能給自己找到房子不值這個價格的理由,不是嗎?)。

同時你不能犯錯誤。在遊戲中選擇大於66的數字的人,在現實中就是在 上什麼學校,學什麼專業,進什麼公司,做什麼事情,嫁什麼人 這種關鍵問題上,在人生抉擇的十字路口,不好好思考,隨便選擇一個,把自己的命運交給了運氣,也交給了別人。

最後贏的人是這樣的,他們努力積極,在關鍵問題上不犯錯誤,同時也不能患得患失。觀察那些沉默的大多數在想什麼,在做什麼。在關鍵時候,只要比大多數人多走一步,就一步,而已!


先猜測一個數字,然後把自己猜測的結果乘以2/3作為最後的答案。

在這裡,我們假設了大家猜的數字接近正態分布,猜測者本人猜的數字處於分布中的一點。由於峰值是概率最高的點,同時峰值近似等於整體平均值,因此猜測結果乘以2/3就是命中率最高的猜測。

當然,實際分布不是正態分布的,平均值也不一定是峰值位置,因此還可以根據自己對於分布的估計進行修正。但是我覺得猜測的方差大到一般沒必要去做修正,如果實在要修正的話,就對選1的人的個數進行估計,因為總會有幾個自作聰明的人會選1,這些人屬於正態分布里的肥尾。因此,在猜測基礎上乘以2/3後再減掉修正值就可以作為最後的結果。


這個題簡單嗎?每個人都足夠理性所以答案是1嗎?好,我們把博弈更進一步。假設你們99人都足夠理性,全都寫1,那麼我找3個人,跟們一起組成4人組合,其中3個人選200,把平均分提高到7,然後第四個人就選5。然後這個選5的就能回答的最準確,其他99人答案是3個200和96個1。拿到獎品,我們四個一起平分,四個人每個人獲得獎品的概率由100分之1變成了四分之一,滿足每個人都是自私的前提。


第一,不要超過133。

第二,當知道大家都知道不要超過133的時候,133*2/3。不要超過89。

第三,同理。60。

第四,40。

第五,27。

第六,18。

第七,12。

第八,8。

第九,6。

第十,4。

十一,3。

十二,2。

結論不超過2。

都會選擇1。

這時候就要考慮人數X的影響。a為選擇數

(X*1+a–1)*2/3結果為b

a–b&沒有紙筆,腦子不夠用了。

上班再說。

簡單算下a&>3+3x

沒有人數限制的的情況下,選200。

但是大家都200的時候。

你選133。

死循環。


不就是道博弈論的送分題嗎,辣么多人把這考點名字寫一下不就得了。

何必寫一大堆解析。

順便說一下,1為極端理想情況,真正玩遊戲我才不按套路出牌(因為1為全部樣本絕對理性的情境,但一旦有人意識到該類問題的現實情境(即必有非絕對理性存在)就會滑向非理性的選擇) (手動滑稽)

還有就是,這種題目或許只能做題目


如果所有人都夠理智的話,集體寫1是唯一最優解。但這是一個無法得到的結果,因為沒有考慮人的變數。(智商、情緒、故意搗亂等)

之前看過一本心理學書,國外一個大學做過這個實驗,結果是大約在最大數的1/5左右。而且經常會有學生寫最大數的。


這種需要考慮玩的人的水平,假設所有人都是一個人,並且足夠理性的話,那麼所有的人的答案都是1。

如果其中有部分人組成集團進行猜數字的話,那麼就是不同集團之間的博弈了。

假設玩的人數足夠大,每個集團的人數足夠多,所有的集團並不知道有第二個集團的存在。且所有的玩家都足夠理性的前提下:

假設組成集團的玩家佔總人數的10%,集團成員之間相互信任。那麼最後答案就應該(200*0.1+1*(1-0.1))*2/3=14。(不同比例以此類推)

如果集團之間知曉彼此的存在,那麼就是集團之間的信息博弈了,這時候獲取到信息多的一方會獲得勝利。至於具體數字,那就會因為集團所採取的不同策略而出現多種結果。

問題來了,並不是所有人都是理性的。那麼這種情況下該怎麼選擇呢?

這時候就需要提前知道參與者整體的下注策略,這種要怎麼知道呢?我想很多人都應該已經猜到了:從所有參與者當中進行多次抽樣調查,然後除去一些雜訊點,最後得到一個平均值。這時候的平均值就相當接近於最終答案了。


在不同課堂上玩過這個遊戲(不過最大值是100)。

心理學課上的winner是21,博弈論課上是13,據老師說還有一個MBA班據說是30左右。看出來規律了嗎~

納什均衡解是所有人都寫1,但必須考慮到人的運算能力是有限的,所以第一次遊戲一般不會這麼理想。

有趣的是,同一群人如果不斷玩這個遊戲,最後會收斂到所有人寫1的。


看到有很多人的答案是1,而另一些人答案里表明,實際情況根本沒到過1。

這讓我想起了有本書里的半句話:博弈中「 理性」 的選擇就是放棄那個純粹理想化的博弈選擇。


博弈論入門問題

所有人選200的情況下,答案是133,所以133以上的數字是嚴格劣勢策略,無論什麼時候都不會獲勝。

考慮到這一點,可選擇的範圍就縮小到1-133之間,重複上一部的行為就會繼續排除到88以上都是嚴格劣勢策略,持續此過程最終所有理性人應該選擇1。

但是現實的博弈中並非所有人都是理性人,有些人考慮了兩部步,於是他寫了88,有些人會想1-200應該是平均分配,於是他寫了66,問題的關鍵不在於你是否理性,而是其他人的理性程度。

博弈論的最佳應對在於預知對手行為後選出最有利於自己的策略應對,純理論的答案是1,非純理論的答案大多數在40左右,值得一提的是,在本科班做這個遊戲會得到30-40的答案,碩士班會得到10-20甚至更低的答案。


無數次的重複以後大家都會選擇最小數字這是毫無疑問的。

問題是人是有限理性而不是完全理性的。

你需要猜測你的對手是什麼水平。

經濟學課上玩過這個遊戲,我們是0-100中選數字。一群大學生,雖然是文科專業的。最後我們的平均數是23,而我寫的是7。

所以想法太超前也不是什麼好事,因為獎品沒有了呀。


遊戲終究是遊戲,沒有實質性的獎勵或者懲罰,參與的人即使絕對理性結果也不會小,因為選200或1或任何數都是一樣的,沒有好處也沒有壞處,收益為零,自然隨便選著玩。

如果有實質性獎勵,比如最接近的人平分一百萬人民幣(真給),那麼結果覺得會和另一個答主說的大學課上實驗差別很大。

最後,這種遊戲的策略得看是否有實質性的獎勵或懲罰,如果沒有就隨便選,如果有就選小一點,不一定是1(因為不確定其餘人是否理性,是否會被誘惑想贏(萬一有個土豪不在乎這點小錢))但應該接近1。最後能不能贏還是得看運氣。


這是一個無解的遊戲,因為當所有參賽者都足夠理性的話,可以得知所有人選擇的數字都是一樣的,這樣無論如何是不存在勝者的。


分頁阅读: 1 2