每個個體的理性行為會導致所在群體的非理性行為嗎？如果會，在實際活動或經濟學中有哪些相關例子或模型？

12-19

觀此文後有感巴菲特「密談」被公布：「房價永不下跌」的假設在創造泡沫
引用一段

基本原因，你知道，根植在人們內心的一種觀點就是，房產價格不會下跌，幾乎每一個人，都屈從於這一觀點。但當人口中大比例都在這種想法的驅動下購買了住房時，泡沫就產生了。

原來你覺得是不可能發生的事，結果隨著時間發生扭曲，人們忘記了買房的初衷，只盯著價格波動。所以，投資者、銀行家、美國大眾，我，我的鄰居，評級機構，國會，凡是你能說出的——絕大多數人們開始相信房價不會大幅下跌。因為房產是美國最大的一類資產也是最容易作為抵押物的資產，所以它可能創造了我們史上最大泡沫。

另外題目可能有些絕對了，那麼如果上面的題目不成立，而把「個體的理性行為」改成「個體的有限理性行為」，這個說法還能成立嗎？

相關問題：非理性的個體為什麼能組成理性的群體？ - 心理學

===================3.23分割====================
有答主提到「群體理性」的定義，而其他答主默認的是群體利益的最大化，那麼這裡也權當是作為「群體理性行為」的定義吧。另外題目也根據回答做了修改，這裡對會造成題述現象的情形稍作總結：
囚徒困境（以及其他博弈中均衡點和最優點不同的情形？）
戴蒙德隔代理論
公地悲劇
「沉默的螺旋」
投票悖論？（還有阿羅不可能定理？）
本題已加入知乎圓桌 ? 日常經濟學 · 博弈人生，更多「博弈論」話題討論歡迎關注

從合作博弈的角度來考慮：如果把「集體理性」的各種不同的理解作為某solution concept的公理，就要對其他公理和希望有的solution concept的性質進行取捨。

比如我們可以認為對於一個合作博弈 $(N; v)$ ,Shapley value是一個滿足「集體理性」的solution concept，因為它要求efficiency axiom，所有參與者分配的收入總和等於他們可以達到的最大的收入總和： $sum_{i in N} ext{Sh}_i(N; v) = v(N)$ 。但問題是我們會問，為什麼只有grand coalition才算做集體？一些參與者也許希望把其他人排除在外，組成一個「小團體」，這不也是「集體理性」的一種理解嗎？一些博弈，比如沒有一票否決權的選舉博弈，不管怎麼分配收入，總有人會想組成新的「小團體」，也就是empty core。

為此，我們可以放棄「集體理性」的假設，最終達成的分配方案的分配方案不一定要滿足在Pareto surface上，也因此更沒必要為empty core，或者Shapley value不在core內而困擾。這是Dubey, Neyman, and Weber(1981)的semivalue的思路。

我們也可以認為，我們模型中的參與者和我們一樣明白對「集體理性」要求那麼強是做不到的，所以會克制，或者限制自己為了更高的收入，不斷地要求組成新的coalition的做法。畢竟，這樣周而復始的改變分配方案現實中對誰都不利(情感關係中這種例子不要太多了)。我們可以把這種追求coalition的收益最大化的動機，限制在某些coalition內。比如某個集合 $S$ 內的參與者的能力只能幫助到這個集合以內的人，也就是對 $N setminus S$ 內的人沒有外部性，我們可以要求最終的給予 $S$ 的分配的收入總和應該至少等於 $v(S)$ 。也就是只要求 $S$ 這樣的集體具有「集體理性」。而這就是Kalai and Samet(1987)的 weighted Shapley value的刻畫條件之一。

以上是經典的MWG對理性偏好的定義。
我們按照這個定義來講。很容易構建一個個體的理性但群體非理性的行為。
例如共有3個人（1、2、3）和3個商品（a、b、c）。（下邊用&>來表示偏好關係）
1：a&>b；b&>c；a&>c
2：b&>c；c&>a；b&>a
3：c&>a；a&>b；c&>b

可以發現這三個人都滿足完備性和傳遞性。因為他們每個人都對abc做出了偏好的判斷，且判斷滿足傳遞性。

那麼理性的個體所導出的群體偏好也滿足這兩條嗎？問題在於如何通過個體導出「社會」的偏好。一個最簡單的方式是民主，也就是按照多數人的偏好來決定社會偏好。

那麼
對於a和b，由於1和3都認為a&>b，所以社會也會認為a&>b
對於b和c，由於1和2都認為b&>c，所以社會也會認為b&>c
對於c和a，由於2和3都認為c&>a，所以社會也會認為c&>a

這裡的社會偏好仍然滿足完備性。但是不滿足傳遞性，因為根據傳遞性，a&>b和b&>c意味著a&>c，然而社會偏好則認為c&>a。

所以這裡通過民主達到的社會偏好就不是理性的。

阿羅不可能和非理性有p關係，獨裁又不代表非理性

關於一個preference的理性，一個比較廣泛的定義是WO：完備且推移

從一群理性人(i.e,preference $R_i$ is a Weak Order, for any i)推論其群體preference（寫作R）是不理性的這個構造並不好，因為首先沒人能保證一堆Ri一定能合成一個R

反過來考慮比較好，我提供一個簡單思路：不完備怎麼辦（incomplete preference） - 知乎專欄

這裡已知有一個非理性的R，然後我們發現它可以被表示成若干個u的集結。顯然，這裡每個小u都可以視作一個理性人的preference Ri，而將R視作一堆理性人集結起來的群體preference

done

那麼反問題主，如何定義「群體非理性」呢？

比如 @Ivony提到的囚徒困境，為什麼囚徒困境是群體非理性呢？因為沒有達到最優的結果么？

如果定義「群體的行為沒有達到最優結果就是群體非理性」，那麼仔細想一想，從委託代理問題到公共物品問題，到外部性問題，都是群體非理性？如果是這樣，同樣由於信息不對稱帶來的信貸周期算不算群體非理性？

個人的rationality是有定義的，我們可以很容易的進行討論。但是群體非理性？定義是啥？

至少我沒看過類似的文獻定義了群體的理性。只能求大神科普文獻了

當然會，

最典型的不就是囚徒困境么？

這不是索羅斯的反身性理論嗎。
其實這個問題取決於信息。
囚徒困境為什麼是困境？因為他們不能互相交流。
泡沫為什麼能瘋狂膨脹起來？人們都不覺得自己是最後一棒。
像檸檬市場，二手車市場，也是因為人們難以對商品的真實情況有所了解。
總結一下，這類問題的本質不是每個個體的不理性導致群體非理性，而是在不充分的信息下做出的理性行為，不見得是理性的。

團購啊，以飯店為例說明。

現在飯店的效益普遍不好，至少媒體是這麼說，並且歸因於反腐倡廉，這可真會給自己臉上貼金。其實根本原因是團購的大發展，導致菜品質量和價格透明度提高，利潤率自然大跳水。

剛開始一些新開張的，還有一些位置不太好上座率不高的飯店被團購網輕鬆攻陷，畢竟房租水電和服務員薪水這些（固定成本）無論客人多少都不能拖欠的，上團購網打些折扣薄利多銷（攤薄固定成本）是有賺頭的。
但是當原本生意興隆的飯店被團購網上的同行搶光了客人，不得不加入團購網之後情況就比較有戲劇性了，這就像劇場里有人踮起腳尖，那他身後的人只能跟隨，最後所有人都踮起腳尖，該看不到的還是看不到，但每個人卻都比原來更累。

個體是可以默認理性的，而所在群體是否趨向理性，必須根據不同情況來確定。

首先，我覺得這篇新聞的內容和題主定義這個題目的內容是有很大的偏差的。

剛好地鐵上看到了這個問題時，正在看一篇新聞，我覺得裡面的內容正好可以回答題主問題
先甩地址索羅斯：中國富人最大的問題是富得沒文化（不要被這個新聞題目誤導了，裡面有很長的乾貨）
新聞里有一篇09年索羅斯論文，主要闡述了索羅斯反身性理論的來源，原文很長，結合題主的新聞闡述下自己理解

作為參與者，人們在經濟活動的認識天生存在著偏差，即所謂的易錯性原則。
錯誤的認識，會導致不當的行為，從而影響事物本身，即所謂的反身性原則。
索羅斯又將現實分為主觀和客觀兩個方面。
反身性的存在的前提必須是有主觀認識存在。反身性可以區分為反身關係和反身性事件
一個反身性事件至少包括一個主觀方面和一個以上的客觀方面，這些方面構成一個反饋迴路
反饋迴路包含正反饋和負反饋兩種迴路。
正反饋即主觀認識和客觀事實偏差越來越大，是自我強化的過程。
負反饋即主觀認識和客觀事實越來越接近，即主觀認識自我糾正的一個過程，經濟學中的均衡其實是負反饋的一個特例。
正反饋造成的自我強化的結果就是導致現實存在的傾向性越來越嚴重，認識和客觀事實偏差越拉越大，最終參與者最終不得不承認認識的偏差，進行自我修訂，從而觸發另一個相反方向的正反饋。
體現在經濟學中就是一個繁榮-蕭條-繁榮的交替過程。體現在房地產行業呢就是一個泡沫積累到破滅的過程。
回到新聞內容，人們對房地產行業的認識就是一個典型的反身性事件，構成了一個正反饋迴路，認識存在著嚴重傾向性，和客觀事實的偏差在越拉越大，最終人們還是不得不重新糾正認識，即房地產泡沫破滅。

說白了反身性理論其實是很常識的一個東西。有點物極必反，否極泰來的意思，但是很多人不願意相信。

看了其他答案感覺題主的問題的題目誤導了很多人啊。

一點淺薄的認識，以上。

當然會。

你去做個試驗，找幾個人，給他們發一紅一黑兩張牌，告訴他們，選出一張牌給你。
如果全是黑牌，就會給每個人付出六元錢。如果有一個紅牌，所有選黑牌的人付你一元錢，選紅牌的人獲得一元錢。

李曉明老師在全國許多高校都做了這個實驗，全黑牌只出現過一次。

我當年選的黑牌，六個人中有兩個人出的紅牌。

可能會，我是認為大多數情況下會，如果只是一味理性選擇但不反思不創造或創新的話。

我知道的，政治學，社會學，人類學裡都有提過。

這個觀點很大範圍流傳廣的是John Nash（約翰·納什）的幾個理論。

舉例：

1.dominant strategy支配策略，結合prisoner"s dilemma囚徒困境一起看。

2.馬克思認為，每個理性的資本家（理性在此判定標準是以利益最大化為根本或首重追求）的個體，當他們合起來時，就組成了非理性的資本主義社會，長此以往，最終走向自我毀滅。（我認同這個，所以拿出來舉例。）

3.lyclic majority 循環多數。
假設三個很理性的理性人甲、乙、丙組成一個理性社會。

甲對理性社會的追求依次是A優於B優於C,
乙對理性社會的追求依次是B優於C優於A，
丙對理性社會的追求依次是C優於A優於B.

如果ABC三個社會模式參選，A:B:C=1:1:1，社會解體，甲乙丙三人散夥。

如果任何一種社會模式參選，或散夥或專制。

如果其中任何兩種模式參選，總有種結果是：未參選的那個的支持率，高於參選兩種支持率高的那個。（AB參選，甲支持A,乙支持B,丙支持A，那A:B=2:1.但是呢，C:A=2:1.）

所以三個人中總是有兩個人在不滿，這就陷入了循環多數。即使把三個社會模式試了遍，還是無法找到更好的社會模式，長此以往，這個由甲乙丙三人構成的理性社會並沒有更加完善，而是會陷在三個模式的扯皮循環中。

Information Cascade (信息小瀑布？)：一群人依次獨立地獲取信息，每個人根據前人的行為和自己的信息做出理性決定，結果可能所有人的行為都不是最優的。

舉個栗子，一個箱子里裝了很多紅栗子和黑栗子，我們需要判斷出紅栗子多還是黑栗子多。如果我自己一個人不停地抓栗子，那麼抓的個數越多，抓出紅（黑）栗子的比例越接近箱子里紅（黑）栗子的比例，我就能越來越準確地判斷出紅栗子多還是黑栗子多。

但是當一群人依次摸栗子……
第一個人摸了個紅的，他說：「我猜紅的多！」很科學。

第二個人又摸了個紅的，他想：「第一個人猜紅的，那他肯定摸了紅的，我這又摸了紅的，當然猜紅的多。」科學。

第三個人摸了黑的，他看前兩個人都猜紅的，心想：「第一個人肯定摸了紅的，第二個人如果摸了黑的，就會選黑的（假設每個人判斷紅黑出現個數一樣時，優先猜自己摸的顏色）。既然他也選了紅的，肯定也是摸了紅的。我這才一個黑的，我也猜紅的！」科學。

第四個人知道第三個人不管摸著啥都會選紅的，所以第三個人的行為不能提供任何信息。於是第四個人和第三個人面對的情況一樣，還是選紅的。科學。

……所有人都選了紅的。

事實上只要出現相鄰的兩個人猜了同樣的顏色，後面所有人都會猜這個顏色。一點點信息就決定了所有人的行為。

這個模型可以解釋各種跟風隨大流的行為，而且是「理性」的。

再次po出我的答案：
本答案來自：
為什麼大學上課的時候很多人不願意坐前排？反映了什麼心理？ - ruiz Posi 的回答

答案正文：
我想以一種動態的視角來回答這個問題，因為我經歷過這種場景而且自己琢磨過這個問題。下面是我的一個思考。

由研一上學期馬哲課座位選擇行為引出的思考

一、背景

研一上學期有一門馬哲課，記不清具體名字了。這種課大家都懂得，如果老師沒有很強的人格魅力是不可能吸引大家去認真聽課的，於是我就觀察了一下一學期以來同學們上課時座位在教室位置的動態變化，做了一個小的建模，對動態行為演進過程簡單的擬合。

二、現象分析：

1、現象：

教室是大的階梯教室，大約能座200人的樣子，而我們上課的人數本來也應該是這個數，但是由於逃課現象太猖獗，真正去上課的不到100人，頂多有50—60人，所以教室是坐不滿的。那麼學期一開始人比較多，大家也都會往前座，但是隨著時間的推移，整體就開始逐漸往後移動，最後全部都聚集到最後幾排。

中間老師也警告大家不要往後坐，並且又一次特別生氣，強制大家全都挪到前幾排，但是隨著時間的推移，大家的位置還是逐漸的向後排移動了。

2、分析：

根據自身體會以及同學們的交流，感覺同學們不是不喜歡坐前面，而是不喜歡坐在別人前面。換句話說，坐在教室前面可以，但是希望前面有人坐著，這樣比較有安全感。或者是這樣一種心理，不喜歡不合群，也就是大家都坐在後面的時候不想自己太突兀的坐在前面。

我想到本科學的謝識羽的《經濟博弈論》中的一個模型：大規模有限理性群體複製動態博弈。於是嘗試構建這樣的模型來擬合這種行為。

三、理論模型

簡單介紹一下這個模型，大規模有限理性群體複製動態博弈。

1、大規模：就是說博弈參與者是處於一個較大的群體之中的，而且個體的效用與總體狀態有關。

2、隨機配對：個體在一個群體中，與多個個體進行博弈，博弈對象的挑選是隨機配對的，這一點是將宏觀群體現象落實到微觀決策行為的關鍵。

3、有限理性：參與者是有限理性的，不能再一次博弈中就達到最優狀態，所以參與者會隨著博弈結果不斷調整自己的行為，或者這是一種學習過程。

4、複製：也就是參與者的動態學習、調整個人行為的過程。

5、動態博弈：是一個多階段博弈，但是這個階段並非是離散階段，是連續的。

四、假設與模型構建

1、個體隨機配對博弈的收益矩陣：

我們做這樣的假設，群體中的兩個博弈參與者是這樣的：

（首先說明，下面說的兩人的決策——坐前面或者坐後面並不是說教室中某些具體的位置，而是以一個相對宏觀的視角來看，實在教室的偏前還是偏後）

（1）如果兩個人都坐在前面，則兩個人收益都是0.5，因為這樣相對安全而且老師不會生氣，而且可以多多少少聽進去老師說的東西（假設有點用）；

（2）如果兩個人一個在前面一個在後面，那麼在前面的收益是0，在後面的收益是1，因為這樣在前面的參與者感覺沒有安全感，受到約束過多，而在後面的參與者心理上有安全感，進可攻（聽課）退可守（玩手機）。

（3）如果兩個人都坐在後面，則收益均為0，這是因為都在後面的話，參與者會擔心會引起老師的反感甚至生氣，老師會挑後排的同學站起來回答問題。

那麼收益矩陣是這樣的：

在靜態博弈中最終的均衡是一前一後，也即（前，後）或（後，前），然而在動態過程中卻是另一種考量。

2、期望收益的計算：

假設群體中某一時間選擇策略：坐在後面的比例為x（x在0到100%之間），那麼選擇策略：坐在前面的比例為1-x；

（1）選擇策略坐在前面的參與者的期望收益：

UF=0.5*(1-x)+0*x=0.5*(1-x)。

基於大群體內隨機配對的假定，因為他有1-x的概率會碰到選擇坐前面的博弈對手，這樣他的收益為0.5；有x的概率碰到選擇坐後面的博弈對手，這樣他的收益為0。所以期望收益為UF=0.5*(1-x)+0*x。

（2）選擇策略坐在後面的參與者的期望收益：

UB=1*(1-x)+0*x=1-x。

因為他有1-x的概率會碰到選擇坐前面的博弈對手，這樣他的收益為1；有x的概率碰到選擇坐後面的博弈對手，這樣他的收益為0。

（3）整個群體平均期望收益：

Uav=x* UB+(1-x)* UF=0.5*(1-x^2)

（4）選擇坐在後面參與者的期望收益超過群體平均期望收益的幅度：

UB-Uav=1-x-0.5*(1-x^2)=0.5*(1-x)^2

3、動態微分方程

我們再來考察選擇策略坐後面的參與者佔比（x）隨時間的動態變化，也就是:

我們根據此模型的理論，它與兩個因素相關：

（1）與坐在後面的人所佔比例x正相關。因為坐在後面的人佔比越高，選擇坐後面的人增加的速度越快；

（2）與選擇坐在後面參與者的期望收益超過群體平均期望收益的幅度（UB-Uav）正相關。因為選擇坐後面比平均水平獲得收益越多，那麼選擇坐後面就越有吸引力，選擇坐後面佔比增加的越快。

那麼我們令：

$frac{dx}{dt}$ =x*( UB-Uav)=0.5*x*(1-x)^2

畫出圖像：

註：圖中那條直線是做的0點處的切線。

4、均衡分析

根據上圖， $frac{dx}{dt}$ 有兩個點同x軸相交，也就是說與x軸交點處，x不再隨著時間變化，也即達到均衡。所以此過程有兩個均衡點，也就是0和1然而只有一個——1處是穩定的。

（1）x=1處是一個穩定均衡點，因為即使有隨機擾動使得x偏離了1，也即比1小一點點，那麼 $frac{dx}{dt}$ 就會大於0，也就是說x會隨著時間的推移增加，最後還是會回到1點。這一點就叫進化穩定策略（evolutionarily stable strategy，ESS）。

（2）x=0處是一個不穩定的均衡點。圖中的直線是0處的切線，我們知道動態微分方程中一點斜率只有為負才算穩定的均衡點，0點處切線斜率為正，顯然不是穩定的均衡。它的不穩定體現在，一旦有隨機擾動偏離0點，那麼 $frac{dx}{dt}$

就會大於0，也就是說x會隨著時間的推移增加，逐漸向1點靠近，最後還是在1點達到穩定均衡。

五、結論

所以根據以上分析，最後的結果是x=1是穩定均衡，也就是大家全都選擇策略坐在後面，這就在一定程度上解釋了教室里所發生的現象。而當老師強制大家坐在前面時，也許當時大家都過去了，到了下次上課，由於有些膽子大的「隨機擾動項」嘗試向後坐，導致群體偏離不穩定均衡0點，而後又發生了逐漸向後移的過程。

六、其他副產品

下面說三個在主體模型之外的我想到的一些現象：

1、謝林分隔模型（Schelling Segregation Model）。這種分隔現象也在教師中有所體現。大家基本是男生跟女生是扎堆坐的，也就是性別相同的坐在一起，而不是混著坐，即使混著坐集體的效用更高。

2、信息瀑流（Information Cascade）。從社會網路分析中學的一個術語。後面的人的行為並非出於自身效用最大化而是根據前面人的行為進行自己的決策。其實這只是一種微觀視角，其實本質上還是在我上面的大規模有限理性群體複製動態博弈的參與者的一種決策形式。

3、信息在群體中的傳播（dissemination of information）。曾經上課有這麼一個小插曲，又一次我跟同學F去上課，當時大家的位置已經處於最後幾排的位置，但是當我們去的時候大家都集中在除了最後一排的最後幾排，也就是說最後一排除了我倆還有個別同學，於是我倆在那嘀咕：會不會是老師說這節課要專門提問最後一排的同學啊。結果我倆就往前挪了，結果最後一排的同學看我們走了，也往前挪了，雖然後面有同學陸續進教室，但是都不敢坐最後一排，因為不知聽誰說老師這節課讓最後一排的回答問題。這就涉及群體傳播學和心理學的一些問題，我暫時不太明白，希望有感興趣的一起探討。

七、思考

也許大家認為這是發生在教室里的小屁孩那點破事不值得這麼複雜的分析。其實這只是現實世界人類群體行為的一個縮影。個體的看似理性選擇，最終卻導致群體非理性的結果。這樣的例子還用我來一一列舉嗎？

經濟學中的外部性，和公共品就是個體理性導致群體非理性的例子

之前有個答案也提到了，囚徒困境是個人理性導致群體非理性的一個典型例子。兩個囚犯本著自己利益最大化的原則，分別選擇了對自己而言最好的策略，但從整體上看並不是最優的。
具體到現實生活中的話，比如一個城市想建一個免費的公園，但需要從居民那裡徵求意見並籌錢。因為公園建好後每個人都可以去玩，所以籌錢的時候每個人都希望別人多出點，自己不出或者少出，來搭便車。最後可能許多居民表示自己不需要公園，結果籌不夠造公園的錢。這是個人理性造成群體不理性導致公共物品提供不足的一個例子，需要政府進行干涉。
當然，經濟學上純粹理性人的假設現實中基本是不存在的，不過大部分人的行為還是會符合一些基本的假設，比如利己等。

如果我們都是純理性人，那麼人類早滅亡了，我們歌頌英雄，崇拜榮譽，本身就是在激勵那些有利於整體而對個體非理性的行為。

在一個正常人和搭順車者同時存在的環境中，經過幾輪模擬，最後導致整個環境惡化的情況。當時看到留下很深印象。
Fu F, Rosenbloom D I, Wang L, et al. Imitation dynamics of vaccination behaviour on social networks.[J]. Proceedings Biological Sciences, 2011, 278(1702):42-49.

我直接舉例回答好看。

這個例子在投資市場顯露無疑。假如每個人都是理性的投資者，那麼羊群效應、價值窪地、泡沫誕生和破滅就會減少甚至消失，要知道很多投資類書（非基本面）都是按著歷史不斷重演，真箇市場就是不斷有人犯錯、有人瘋狂、有人理性，盈利和虧損的人數總是接近二八現象。不要忘記了有個指標就是看參與者人數（利用二八現象）來做投資決定的。每個個體的理性那麼這些現象我認為會大大減少甚至降低。（參考歐洲與中國大盤這兩個投資風格迥異的股市歷史走向）

全部是基於理性還是非理性？

我覺得這個和群體心理學有關，當個人做決策的時候往往是理性的，因為我們在做決定的時候往往看身邊的人