這個關於分配財富的博弈論模型試驗有什麼心理學解釋?
給紅方100美元,他可以選擇分一部分給藍方。比如說,紅方想自己留70,給藍方30。所以他跟藍方七三開。然後控制權轉給藍方,藍方說:「我接受。」這樣他就能拿到錢,或者藍方可以說:「我拒絕。」這樣兩人都什麼也拿不到。所以,這樣一個理性選擇的經濟學家會說,只要不是十零開,你都應該接受。但人們會怎麼做呢?當八二開以上的時候,人們的選擇都沒有差別,在八二開的時候,選擇接受的概率就跟拋硬幣一樣了。
是貪婪嗎?還是覺得不公平而已?
謝邀!
事實上,的確有心理學家做過這個實驗,行為經濟學家也做過這個實驗。但有很多信息需要補充!
當時他們用的是20美元來做實驗。發現:
1. 大於15(紅):5(藍)的方案幾乎都被拒絕了。2. 10:10被提出的次數最多,也最容易被接受3. 小於5(紅):15(藍)的方案也被大量拒絕。這個實驗結果被反覆在多個國家驗證
這些實驗是對理想博弈論模型的一個補充,或者說為世人提供了一個不同於經濟學家對世界的認知角度。人們在日常生活中參與博弈,並不只是靠死理性,而且就算數額很大的各種金融交易,也多會產生某種其它的東西。
在這個實驗中,比較明顯的是一種「公平」的概念,即「你如果給我很少的錢,那就是不公平,我就寧為玉碎不為瓦全了」。而不那麼明顯但更重要的則是一個「尊嚴」的概念:你給我少了是不尊重我,你給我多了也是看不起我。尤其是後者,也就是實驗發現3中出現的現象,更值得人們討論,因為這完全違反人所謂「貪婪的本性」。
事實上,尊嚴在日常經濟生活中也經常出現,很多人在經濟活動中並非單純逐利,而是追尋一種個人價值的肯定,因此任何否定其個人價值、個人尊嚴的行為,不論是否獲利,都有可能受到其嚴重反感,雖然不能說一定導致交易不能完成,但這是一個非常有影響力的因素。大至企業併購,小至日常百貨促銷,企業決策者、公司管理者、廣告和營銷人員都需要注意這一點。
再進一步,為什麼10:10是最多被提出、也是最多被接受的方案呢?這是因為兩個人貪婪的相互平衡,還是因為人類本身有一種人與人之間的平衡觀念,還是因為,人類的本性趨向互助?
答案很有可能是人類互助的「本性」。
從進化心理學的角度講,人類在漫長的進化中其實有很多不同的生存策略,比如各自為營,或者結合成小組、團體來活動。小組和團體的合作比起單兵作戰顯然有優勢。因為人類中不存在全能的上帝,個體有一定優勢就有一定劣勢,組成團體後,自己用優勢能力為團體服務,而團體則補充他劣勢的能力。這種互幫互助的策略,使採取這種策略的人更容易生存下去,生存的好,並繁衍後代(畢竟你需要在一個有其他人類的地方才能遇到異性。。。)。而單兵作戰的人,則更容易受到野獸襲擊,在追擊獵物途中無人供給食物和水,受傷時無人照料,採取這種策略的人死亡率較大,更不容易繁衍後代。
所以,互幫互助(或者說與人合作、與人為善)這種策略在長期的進化競爭中更好地繁衍了子孫,也就是說,具備互助這種特點的基因的人更容易繁衍,並將這種策略傳承下去,成為了大多數人所採用的策略。這也是為什麼我們的大多數文化、社會也都鼓勵這種「見面分一半」的行為。我們不希望被人看成不友好、不合作的人,希望被看成友善、誠實、有愛心的人。這既有社會原因,也有生物原因。
那你可能又要問了,那些不合作、欺騙、剝削合作夥伴、利用別人善心的人,他們從哪來的呢?一方面有教育和社會的原因,另一方面也有基因方面的原因。如果大多數人都善良且樂於幫助,那麼有些人就可以利用別人的善良鑽空子、大量謀利、大量剝削等等。因此,這些人雖然是少數,但在某些情況下依然是成功的生存策略,因而就得以獲取資源並繁衍下去,在人類基因池中保留了這部分基因。
這也映照了經典博弈論中不少博弈模型,即在某些情況下,不合作變成了最佳策略。所以經濟學和心理學其實是相互映照、互為補充的。謝邀。
通常情況下這類實驗屬於社會心理學分支,參加實驗的被試都是普通人(而非抑鬱症患者或賭徒等特殊人群),實驗的目的是驗證特定環境下人會做出怎樣的行為。這類實驗屬於心理學的理論研究而非應用心理學、臨床心理學的研究。個人認為,從心理學的理論研究的角度來考慮某個問題或現象的時候,使用」貪婪「或」公平「這 種主觀性很強的詞來解釋意義不大而且有弊無利。我們來判斷一個人是「貪婪」還是「公平」的方法就是看他如何分配利益,如果再用「貪婪」和 「公平」這些詞來解釋這一分配過程,就成了循環論證。所以,貪婪或公平並不是原因,而是環境造成的結果。
在這個實驗里,每個人的選擇都有可能不同,是因為每個人的生長環境不同,導致其策略不同;在某些特定的實驗環境下,做出的反應也不同。這裡說的策略並不是主觀的計劃計謀,而是一個通過與環境的互動而形成的"感覺",包括紅方策略(分給對方多少對方容易接受)和藍方策略(自己選擇接受與拒絕的底線金額)。
生長環境帶來的不同主要表現於人們是否習慣於分享,是否能夠站在對方的角度來考慮問題。比如,在一個完全弱肉強食的環境(比如,戰爭時期)中生活過來的人,和在一個太平盛世提倡相互幫助相互分享的環境中生活的人,所作出的選擇很有可能不同。而實驗環境的不同,也會導致結果不同。會影響實驗結果的環境因素有很多,除了上面所說的參加實驗的被試的個人情況(年齡、收入、教育環境等等),還有紅藍雙方的關係(之前是否認識、兩人之間的關係、現實中有沒有利益關係、相互有好感還是相互厭惡)、實驗是如何進行的(實驗進行的國家地區、紅藍方是面對面進行交涉還是在不同房間通過操作電腦等設備來進行分配和選擇、實驗是可重複博弈還是單次博弈)等。實驗所涉及的金額也會影響結果,比如,將金額改成10美分或1億美元,其結果恐怕會有所不同。這個實驗里的100美元是很大的金額,所以應該是假想實驗,也就是說,假設這裡有100美元來讓紅藍方分。這與真正能夠得到分配金額的實驗還是很有可能有差異的。根據題目中的說明,我認為這是一個單次博弈(這個詞也許用的不對,求指點)。這樣的情況下我們不可能像買東西討價還價是那樣有機會試探對方的策略。這有可能使紅方在給出方案時做出一定的讓步,以防止對方拒絕導致自己一無所獲;而藍方的決定受其經濟條件影響,如果手頭比較缺錢,那麼分得的再少也比沒有強。貌似題主是從一個演講中得知這一實驗的。演講者引用這一實驗結果的意圖我不知道,但脫離演講內容,單拿出「八二分時接受拒絕各50%」這一結果恐怕說明不了什麼問題。
幾句題外話。這裡所說的受環境影響,其前提條件是「人類具有分享這一能力」。雖然作為生物來說,自己獲得利益看起來是傳播自己基因的最佳方式,但有時候與他人合作並分享利益其實更易於提高整個群體或物種生存下去的幾率。這也是一種通過演化而得到的生存策略,如有興趣可以參考「整體適應度」這一概念(http://zh.wikipedia.org/wiki/%E6%95%B4%E9%AB%94%E9%81%A9%E6%87%89%E5%BA%A6)。自然界中的例子有真社會性動物(螞蟻等)的社會分工,以及包括人類在內的多種動物身上觀察到的"利他行為"。螞蟻,大家都知道有蟻后工蟻等分工。其實哺乳動物里也有真社會性動物,目前發現了兩種,其中一種是生活在非洲的裸鼴鼠(長相實在不敢恭維,各位看官做好心理準備http://zh.wikipedia.org/wiki/%E8%A3%B8%E9%BC%B9%E9%BC%A0)。這種社會分工導致大部分個體無法傳播自己的基因,但這一群體甚至這一物種的基因卻能得以有效傳播。利他行為是犧牲自己的利益來幫助其他個體。比如,有些兔子會在發現捕食者時冒著暴露自己位置的危險發出叫聲,其作用是通知附近的同伴危險來臨;有些鳥類在成年後不會立即離開父母,而是會花一年時間(大概是這麼長,記不清了)來幫助父母照顧自己下一代的弟弟妹妹;而有些吸血蝙蝠會分給群體中其他個體食物。這些行為都犧牲了自己的利益但卻使物種更容易存活下來。兔子雖然暴露了自己但周圍的同伴(通常是有血緣關係的)卻更容易逃過一劫,使基因得以傳播;鳥類幫助父母照顧後代會使弟弟妹妹的成活率更高,有利於家族基因的延續;而蝙蝠在分給其他個體食物之後,作為回報,在自己餓肚子的時候從這隻蝙蝠那裡分得食物,這種機制使得蝙蝠的個體死亡數減少,有利於傳播基因。所以,很多生物會在特定情況下與其他個體分享利益,這並不是人類所特有的。前面的都答得很好。我從更寬大一些的角度來說吧。
最簡單的答案是:人在做出某種行為的時候,並不是完全出自於「得到利益」或「得到最多利益」的動機。人的動機是多元的。
人行為的宗旨是:讓自己滿意。或者說是:做自己覺得自己會滿意的行為。
有趣的是「讓別人滿意」也是「讓自己滿意」的一個因素。利他行為也能給個體感到滿意。
就像@程毅南 同學所給出的實驗細節。給自己留得少,分給別人多。這種行為也會出現,而且居然被拒絕得也多。這說明得到多少錢,並不是人「滿意」的唯一因素。
很可能那些給自己留得少,分給別人多的人時候會後悔。這就是我前面所說的:「做自己覺得自己會滿意的行為。」但很可惜他對自己的判斷出現了一定失誤。
人作出決定的時候,要推測別人的想法(包括對方怎麼看待自己),還得預測自己將來的感受。即使紅方自己留下99美元、分給藍方1美元,理性的藍方也只能接受,這比什麼都沒有要好。
但是藍方有沒有更好的選擇呢?有的,這叫做「威脅策略」。一、威脅
1、不可信的威脅藍方宣稱:「我絕對不會接受少於40美元的分配方案」。這是一個威脅。
紅方需要考慮:藍方說的是真的嗎?威脅有可能是假的,藍方或許只是虛張聲勢。如果紅方分39、29或者1美元給藍方,藍方可能還是會接受——因為藍方應該是理性的,理性的人就應該接受這個高於0的方案。紅方選擇拒絕,這是合理的。藍方如果心智正常,他就該接受1美元的分配方案,他宣稱的威脅「不可信」。
所以紅方提出了1美元的分配方案。藍方拒絕接受。
注意這一步,這是十分奇怪的選擇。理性的藍方不應該拒絕這個方案,因為拒絕之後他什麼也得不到,但是他還是拒絕了。結束之後你們會看到原因。總之第一次博弈到此結束,紅方和藍方都沒有得到一分錢。2、不確定的威脅
在正常的生活中,博弈還會不斷重複。第二次紅藍雙方又見面了,藍方依然重複著自己的威脅:「我絕對不會接受少於40美元的分配方案」。
紅方十分猶豫,因為藍方在第一次博弈中已經表現得非常不理性,紅方需要重新評估藍方的策略。這次紅方分配20美元給藍方,比第一次有改進。藍方依然拒絕了。雙方再次一無所獲。3、可信的威脅
接下去是第三次博弈,藍方繼續選擇了威脅策略。根據前兩次的博弈結果,藍方似乎不理智,他的威脅最初看上去不可信,但他先後拒絕了1美元和20美元的分配方案,或許他真的不會接受低於40美元的分配方案。結合以前的經驗,紅方終於認為藍方的威脅是可信的,他確實不會接受低於40美元的分配方案。紅方這次選擇了60:40,藍方也接受了。從三次博弈的結果來看,藍方一共獲得了40美元。如果他沒有選擇威脅,每次都默默接受1美元的話,現在頂多只有3美元而已。
回頭來看,藍方在單次博弈中似乎很不理智的選擇,在不斷重複的博弈中反而是更優的。
而在單次博弈中最理性的選擇,在多次重複博弈中反而比較差。二、相互威脅與妥協
我相信很多人會對威脅感興趣,但威脅不是沒有止境的。如果藍方聲稱自己「不會接受少於80美元的方案」,只留給紅方20美元,可以嗎?這取決於紅方。如果紅方選擇單次博弈中的理性方案,有點兒總比沒有好,那麼紅方會接受的。但更合理的推斷是,紅方和藍方至少應該是差不多的人,紅方也有威脅的能力。
如果兩個一樣的人相互威脅,結果會怎麼樣呢?簡單的結論是,50:50的方案對大家最好。如果兩個都想通過威脅策略拿到51塊錢,他們永遠不能達成一致,得不到一分錢。如果兩個人都只想得到49塊錢,中間會剩下2塊錢沒有被瓜分掉,聰明的人是不會視而不見的。
這就是為什麼50:50的方案最常見、最可行,雙方感覺也比較舒服。三、關鍵點
關鍵點有兩個。首先博弈必須是反覆的,一次博弈中沒有用。威脅策略會讓藍方在第一次博弈中輸掉1塊錢,如果沒有後面的博弈,藍方永遠也掙不回來,這個策略就不划算了。其次威脅必須是可信的。藍方通過前兩次不理智的行為,強化了威脅的可信度。實際上藍方也能找到其他辦法——比如「我欠了黑幫40美元,如果今天還不上的話他們就會殺了我」。如果這件事情是真的,紅方就會迅速相信藍方的威脅,或許第一次博弈就會以60:40的局面結束。這個理論框架也現實情況也很接近。現實談判中的很大一部分就是關於相互了解、試探與威脅。@Raymong Zhang 以前提到過一部關於談判的電影,很傳神的表現了「威脅」與「可信的威脅」,可惜我忘了電影的名字了:)反對除 @張熤 外的幾乎所有答案,而且只需要一句話。
所謂人理性地追求「利益」,這裡的「利益」是針對效用(utility)來說的,效用來自支付(payoff)而非結果(outcome)。
這是我覺得我看耶魯大學公開課博弈論所學到的很重要的一點,而且這一點在我國內上過的兩門博弈論課上都沒有提出來。
當我們說,紅方拿到XX元,藍方拿到XX元時,這是結果(outcome)。
一般來說,我們會假定紅方的支付(payoff)等同於結果,即u(x)=x。然後我們把理性建立在這樣的效用函數上,就會說:你看,紅方在實際實驗中「非理性」了。
但實際上,我們可以認為,雙方在意的不僅是自己得到了多少錢,可能紅方在意雙方是否公平,或者在意自己的聲譽,甚至他只考慮對方賺了多少錢。因此,紅方的支付可能就是u(x)=|x-(20-x)|,甚至u(x)=20-x。在前者的基礎上,紅方會傾向於選擇公平的分配;在後者的基礎上,紅方甚至會傾向於選擇有利於藍方的分配。這些,都是紅方理性選擇的結果。
經濟學家一直以來的一項重要工作,就是確定人對於各種不同的結果(outcome)到底是如何處理的,在此基礎上業發展出了各式各樣的效用函數。
哦對了,經濟學家所謂的理性(作為名詞)才不是什麼「追求效用最大化」呢。經濟學家的理性叫作,應該叫作:對於所有可能的選擇構成的集合,偏好是建立在這個集合上的偏虛關係。所以,只要我能對不同的結果分出好壞,而且如果我喜歡A勝過B,喜歡B勝過C,我永遠喜歡A勝過C,那麼我就是理性的。所以雖然行為經濟學家一直在談論非理性,但其實只有一種情況下這個名詞才適用,那就是我喜歡A勝過B,喜歡B勝過C,喜歡C又勝過A。
說實話,我對於很多人不能理解這一點感到非常困惑,類比到社會學裡面,你要說一個社會是好的,不是還要分功利主義或者羅爾斯主義等等嗎?這其實就是一個社會效用函數,假定所有人在這個社會上得到的利益是x={x1,x2,...,xn},功利主義就是U(x)=x1+x2+...+xn,羅爾斯主義就是U(x)=min{x1,x2,...,xn}。既然社會覺得好的標準都不一定,憑啥人就一定是追求金錢的呢?這個問題很有意思。從博弈論的角度來看,最後的納什均衡肯定是第一個人選擇一個無窮接近於所有錢的數額,第二個人選擇接受。但是博弈論對參與人的假設是嚴格的,例如完全信息,完全理性。而現實中的人是非理性的。就像你用聰明人的思維去揣度一個傻子,那你一定是錯的。但是讓我們首先不要把人想像成傻子,看看有沒有可能這是理性的結果。第一種可能是,人可能非常偏好公平,也就是說,他們在錢上獲得的快樂受別人有多少錢影響,所以一切都是相對的。假如我有100塊錢,你有200塊錢,那還不如我只有10塊錢但你有1塊錢快樂呢。區別就在於,你有多重視別人有多少錢,這種重視程度是不確定的,也就是參與人有不同的類型,這也就解釋了為什麼70 30的時候接受不接受是隨機事件。第二種可能是,我們考慮的納什均衡是一個一次博弈,而現實生活中經常會有重複博弈。可以把這種拒絕看成一種「冷酷策略」。也就是對不合意的分配一律拒絕,這樣對方也得不到好處,在下一次博弈的時候,他就會選擇一個合意的分配。因此這是一個犧牲當前而獲得長遠意義的機制。這是人在生活經驗中獲得的思維慣性,在這個實驗中他們受這個慣性影響,而做出了看似非理性的決策。
從程毅南老師的答案里看到該實驗的細節。我的一個猜測是,當兩個人對這筆錢有相同分量的談判籌碼時(分配權和否決權),大家的期望就是一分籌碼一分收穫。符合人性對公平的天然追求。我想改一下該實驗,以驗證我的說法。更改結果如下:藍方否決權改為十分之一否決權。即紅方給出方案後,藍方可以否決,但需要扔一個十面骰子,只有扔出十點,藍方的否決才能生效(否決生效,即這個錢誰也得不到,兩人都兩手空空,雙輸)。扔出其他點,則該分配方案即可立刻實施。我猜測,這種情況下,在一九開時,藍方使用否決權的意願最低。
這個是個非常經典的行為經濟學實驗。在不同國家實驗結果會有不同,但是都和理論預測有很大的出入,實驗結果不會收斂到99,1這個理論預測結果,比較極端的就是80:20了。
這個實驗結果是有非常堅實的腦科學研究支撐的。在進化中,人類大腦進化出一套被稱為「同理心」的機制,所以當男的看到蛋蛋被踢爆的時候也會覺得蛋疼。斯密在道德情操論裡邊將道德起源歸因於同理心也是一個道理,因為我們能夠感受到其他人的痛苦,所以會自然引發出「同情」等一系列有利於合作的情感(行為經濟學一直致力於解釋人類社會中,合作何以可能)。換一個角度來說,公平感某種意義上來說是與生俱來的。
有一些很好玩兒的實驗證明了面對面的時候更容易激發同理心,產生同情,信任的情緒。所以當隔著電腦屏幕做類似分配實驗時,結果會更偏向於經典博弈論結果。
基於這個問題的更廣的推論是人類社會大概有三類人。第一類人是自私的,也就是會按照經典經濟學假設來行為。第二類人是具有一定利他性,在合作中被欺騙一次以後會傾向於不再合作。還有一類是強利他性的人,不管在什麼情況下都會採取合作,且對欺騙行為進行不計成本的懲罰報復(關於這個分類也是有相關實驗的,比如在公共品實驗中可以加入你願意支付多少對什麼都不支付的人進行懲罰)。這樣一種結構保證了人類社會合作的可能,因為大多數人天生傾向於合作,而強利他性的人會主動懲罰非合作的人,保護了第二類人的利益。其實原因很簡單。
如果是理想的博弈,並且金錢就代表對應的數值的話,那麼只要不是 100 和 0,我都應該接受,因為在這種情況下,我獲得的收益一定嚴格地大於 0。
但是,人類不是完全理性的,並且收益和獲得的金錢也並不完全等同(也即不能完全地理想化)。導致駁回一個 「不合理」 分配,比如說 80 - 20(提議者 - 接受者,下同),的理由有很多。針對不同的人有不同的可能。
第一種就是有很多錢,並且不希望別人賺錢的人,對於這種人,降低對方的收入是優先於增長自己的財富的。所以即便你的分配方案是 10 - 90,對於這種人他也有可能駁回。簡而言之,他的目標和你的預期不在一個維度上。當然,我們可以找到另一種這種人的變種,就是認定自己得到的必須必你得到的多,否則就拒絕的那一類人。對於這種人,雖然他不會駁回所有比例的分配,但是超過 50 - 50 的他肯定都不接受。第二種情況是,雖然我也想獲得一定的金額,但是太少的金額對於我來說沒有意義,比如說,如果是分割 10 元的話,你給我 1.5,我連坐公交車都坐不了,零錢放在我口袋裡還麻煩(這一點體現出來了金錢的數額不是唯一的標準)。乾脆不要算了。第三種情況是,雖然我很想要這一筆錢,比如說分配 1000元,你給我 100元,但是我覺得這實在是太不公平了,並且考慮到以後我們兩個人還有進行博弈的可能,我需要通過我的駁回來發出一種追求公平的信號,讓你不這樣做。這種做法常見於多次博弈中,比如說兩個人要進行 100 次這樣的博弈,假定每次都是分割 100元,一方可以通過不斷拒絕的方式迫使對方不斷加價(比如說加到 50 - 50?)。這裡可以做一個簡單的計算,假設我們前面花費了 50 個回合來進行討價還價,(從 1 - 99 漲到 50 - 50),那麼我最後的收益是 2500,而如果我一開始接受了,或者是半路上接受了一個價格,那麼最後的收益都少於 2500,另外,有趣的一點是,由於我這裡恰好選擇了兩個 100(100 次和 100 元)所以 50 恰好是一個最優解。其實我不太贊同使用貪婪這個詞來進行概括,也不贊同將這個模型簡單地歸結為公平或者不公平。如果人性只有貪婪,那就好計算多了……╮(╯▽╰)╭以上用人性解釋都是錯誤的,這其實是多次博弈與單次博弈的偏差。
理性人是一種理想狀態,他只需要這次博弈,而不存在前後狀態,但現實的人類,在長期進化中,我們基本是生活中多次博弈中,多次博弈和單次博弈的結果本身就是不同的。
為什麼說100美元不行,20美元不行,100億就可以呢?
因為100美元這種價值的博弈我們生活中比比皆是,早就是多次博弈了,因為服務態度不好拒絕吃某個好吃的餐廳,因為老闆要價太高拒絕喜歡的商品,等等,都屬於這種博弈。
為什麼100億可以。因為你這輩子不大可能再遇到第2個願意給你1億的傻瓜。試試如果天天都是100億博弈,估價過一個月你就會把100億當做100美元了。博弈論有兩個基本假設,經濟人假設和理性人假設,在博弈過程中必須保持利益最大化同時要按套路出牌,在現實生活中有的行為就是不按理性出牌,關鍵是利益最大化並不好界定,就比如說這個模型,按著這兩個假設只要不為零就可以,但現實中肯定不行,就比如不患寡就患不均心理在作怪,咱倆對半分,否則誰也別想要
推薦閱讀:
※一個人在「想學習、假學習、失敗了和想學習」的循環里重複四年,其深層思想問題是什麼?以後可以做什麼工作?還適合讀書嗎?
※口吃是什麼原因造成的?應該如何防治呢?
※教育學當中有沒有關於「師生之間信息不對稱」的論述?
※有一個有錢的室友是種什麼樣的體驗?
※為什麼賭場里的賭徒會在明知遊戲對自己不利的情況下選擇賭而且賭到傾家蕩產的地步?