人們對未來的預期反過來會影響當下的行為,如果人們又據此調整預期,如此循環的結果是什麼?

想到生活中很多問題都處在這樣的無限循環中,覺得A線路不堵車→選擇A線路→別人也會選A→不選A→……


混合策略納什均衡

update:

補充說明:

1. @不知彼岸 的回答更全面。

2. 實際上這(可能)是納什當年的思路:純策略可能有循環,而沒有純策略納什均衡,那麼我們就拓展到混合策略,純策略本身是離散空間,混合策略就是連續空間了,在多維連續空間內,對每個點定義Best Response函數,假如最終有一個點的最優反應就是本身,那一定是上述函數下的不動點。一定條件下(比如納什所證明的finite game,也就是玩家人數有限,策略數有限的博弈),由Kakutani不動點定理(據說Kakutani本人不知道有這個定理2333),該不動點存在,就是混合策略納什均衡。(有些用語不太嚴謹,如有問題請指教)

update:

看到 @張小肚 的回答提到了Arthur(1994)的內容,正好前一陣子翻了一篇同一作者所寫的文章,和這個問題也算是高度相關,貼出來以饗諸位:

《非均衡經濟學與基於代理的建模》

作者/ W. Brian Arthur

2005年3月4日,

在過去二十年間,研究經濟學的一種新方式正在逐漸登場。它常常被貼上這樣幾個標籤:複雜經濟學、計算建模、基於代理的建模、適應經濟學、虛擬經濟體研究、生成性社會科學——每一個標籤都擁有自己的獨特之處、追隨者和細微差別。不管貼上的是什麼標籤,我相信,現在正在發生的遠不止是一堆基於計算機或是基於代理的研究。這是一場經濟學的變革。

為什麼這是一場變革?一個所有從業者都同意的答案是,隨著上世紀80年代經濟學家得到了台式工作站的幫助,基於代理的建模也應運而生。這是我們第一次能夠不僅研究均衡本身而且探求它們是如何形成的。基於代理的建模研究的是經濟體中的模式是如何形成的(我喜歡Joshua Epstein所使用的術語——生成性解釋),而通常這樣的形成過程過於複雜以至於無法解析地解決——因此我們得求助於計算機模擬。這沒什麼問題,但這是否意味著基於代理的計算經濟學只不過是傳統經濟學的補充,在傳統經濟學基礎上加點關於模式形成過程的東西而已呢?而且,如果它主要依賴於在計算機上模擬經濟過程,這是不是對理論的一種迴避呢?這種經濟學的研究方式,到底給我們提供了什麼呢?

在這篇概述中,我想要指出,這場變革並不是新古典經濟學的補充;它絕不止於此。它是從考察均衡下的經濟學問題向考察非均衡下的經濟學問題的轉變,向一種更加一般化的經濟學——非均衡經濟學的轉變。

在我開始之前,需要給讀者們一個預先聲明。這篇文章闡述了基於代理的經濟學的本質;它並沒有回顧基於代理的計算理論文獻,也沒有給出如何進行基於代理的計算的具體說明。這兩個主題已經在別的文章中得到了很好的闡述。

我將從經濟體本身而不是基於代理的建模的討論開始這篇文章。

在平衡之外

經濟代理——銀行、消費者、企業、投資者——不斷調整自己的市場行動、購買決策、價格和預測——對於這些行動、決策、價格和預測所共同創造的情境的預測。換句話說,個體的行為共同創造了一個總體的結果,然後它們對這個結果做出反應。這並不是什麼新鮮事:至少從亞當·斯密開始,經濟學家就用這種方式看待經濟。行為創造了模式,模式又反過來影響了行為。

在這樣的設定下,經濟理論家們很自然地會去研究,經濟代理們所創造的模式是如何逐漸顯露的。這顯然是一件複雜的事情,因此為了尋找解析解,歷史上經濟學採取了簡化問題的做法:它轉而研究,怎樣的行為能夠創造出某種特定的結果或模式,其中不存在改變行為的激勵。換句話說,它研究的是經濟體在均衡狀態——與創造出該經濟體的微觀行為(行動、策略、預期)保持一致——時會有怎樣的模式。我們有許多這樣的例子,例如一般均衡理論會問:在經濟體的市場中,怎樣的商品價格和商品生產及消費的數量,能夠與價格和數量的總體模式保持一致——即不存在對其進行改變的激勵?博弈論會問:給定對手可能選擇的策略、行動或分配,怎樣的策略、行動或分配能夠保持一致——即(在某些標準下)是代理的最佳行動?理性預期經濟學會問:怎樣的預測(或預期)能夠與這些預測或預期共同創造的結果保持一致——即平均意義上(on
average)是自洽的?局部均衡經濟學——比如說在國際貿易理論中——會問:怎樣的國內行為(local behaviors)創造的國際貿易模式(larger patterns)能夠支持這些國內行為(即保持一致)?

對均衡的研究方法通常採用方程的形式。根據定義,均衡指的是一種不變的模式,因此在方程的形式下,我們可以研究它的結構、推論和達成的條件。當然,為了能夠這樣分析而做的簡化也需要付出代價。為了確保這種易處理性,我們往往必須假定同質(或完全相同)的代理,最多也只能將其分成兩到三類。我們必須假定人類行為——一類出了名的複雜的事物——可以用簡單的數學函數來表達。我們必須假定代理的行為是智慧的而又不存在激勵去改變,這意味著我們必須假定代理和他們的對手們充分利用了所有他們認為可能有用的信息來做出決定,如此才能保證他們不存在激勵去改變。儘管如此,作為一種進一步分析的策略,均衡研究得到了巨大的成功。隨著它演變為今日我們所熟知的新古典結構,它所建立起的對經濟學的認識,其程度足以為其他所有社會科學所欽羨。

我相信,經濟學目前正在努力超越這種均衡的範式。我們自然會去問,代理的行為是否會不與其創造的總體模式相一致,而是更一般地,其行為、策略或預期隨著其所創造的模式作出反應——或者說內生地變化。換句話說,我們自然會去問,經濟體在不穩定的狀態下——也即非均衡時——會有怎樣的行為。在這個更加一般化的層面上,我們可以推測,也許經濟模式能夠在充分長的時間內收斂到一個簡單、同質的均衡,但也有可能不會收斂,而是不斷變化,呈現恆新的行為。我們還可以推測,也許它們會呈現出穩定狀態下不曾出現的新現象。

這種研究方法的本質,使得它需要個體行為如何隨著不同情境的展開而進行調整的細節說明;因此它是演算法化(algorithmic)的。而又由於學習或做出反應的不同方式有可觀的選擇餘地,這種研究方法沒有理由認為行為的調整是完全相同的。不同的代理將分別進行考察,因此這種研究方法是基於代理個體的。於是,考察非均衡的經濟模式自然地需要引進演算法的更新和代理的異質性,而解決這兩點最好的方式就是通過計算。

對於這種經濟研究方法,一種可能的反對意見是,因為這種方法是計算性的,它並不能構成理論。但這是種過於輕率的說法:如果根據一系列假設得出結論是理論,那麼這個結論是用手算還是用計算機算出來的並無關緊要;兩種方法都能產生理論。當然,風格的差異總是存在的。基於方程的方法,給出的是方程形式的結果分析和方程形式的有效推論(call for equation-based dissection of the results—and equation-based
discovery of telling implications),這樣的分析往往能夠嚴謹地完成,但這種嚴謹性常常是似是而非的。推論與現實的相符程度不會超過所選擇的假設和函數形式與現實的相符程度;而這些函數永遠只能是現實的抽象——如果仔細核查的話(when closely examined),只是現實的總體層面——所以基於有問題的假設給出的嚴謹的演繹結果仍可能有很大的誤差。基於計算機的方法在這些方面有所不同但又大致相仿:它給出的是所發現現象的統計式分析(It calls for statistical dissection of the phenomena discovered),在許多基於計算機的模型中,很難從如灌木叢般雜亂的事件中分辨出特定的現象。由於不切實際的假設和無謂的複雜性造成的誤差同樣存在。此外,做好基於計算機的經濟學研究並不比做好解析式的經濟學研究更容易:一份好的研究,應該能夠在一個有效、簡單的計算模型實驗清晰地展現某種現象時發現其優雅之處(shows an eye for elegance of experiment for the telling, simple,
computational model that demonstrates a phenomenon clearly),或者在一大團雜亂無章的其他數據的掩蓋下發掘出某種現象。

當然,兩種風格可以混合使用。如果計算中出現了某種現象,它通常也能在一個更簡單的解析模型中被重現。反之在解析中出現了某種現象,它也能通過計算的方式被探查到。準確的說,計算並不能代替理論。它只是允許更多現實的假設,並且能夠容納一些非均衡的行為,於是它在這個意義上擴展了理論。我想強調的另一點是,我們應當記住,探索非均衡的經濟體並非必須使用計算的方式。原則上我們也能用解析的方法來做這件事,就像在一些特定的案例——尤其是涉及學習機制的案例——中已經做到的那樣(Samuelson, 1997; Fudenberg and Levine, 1998; Brock and Hommes, 1998)。但對於大多數基於代理的情境,解析式的生成過程是極為複雜的,因此不得不求助於計算。

另一種反對意見認為,由於非均衡的研究需要對於個體行為如何調整(以及代理如何互動)有詳盡的建模,這將使得行為的假設過於特殊。這一看法有些道理:假設有時候確實是出於方便而選定的。但我們需要記住,「理性行為」的標準假設是高度格式化版本的現實(highly stylized versions of reality),如果在對代理如何進行調整建模的過程中要求我們更加嚴謹地研究和思考實際上的人類行為,這應當被視為一個優點。

非均衡的研究並不能回答所有可能的問題。它們通常無法告訴我們品味是如何形成的,科技是如何形成的或者結構是如何形成的。David Lane(1993)指出,這些研究「對於新結構的出現提供了有限的見地——而對於更高層次的實體(higher-level
entities)的出現,迄今為止毫無貢獻。」出現的只是模式,而不是階級結構。(What emerges is pattern, not
hierarchical structure.)

關於基於代理的研究,一件值得注意的事是,它們幾乎總是採用演化的方法。為何如此呢?先前我說過,大多數研究都遵循的假設之一是代理面對總體模式會做出不同的反應;他們有不同的條件,不同的歷史,不同的哲學觀。也就是說,代理是有適應能力而異質的。乍一看,這也許只能將標準的同質理論做一個平凡的拓展成為標準的異質理論。但試想,如果異質的代理(或者異質的策略、預期)隨著它們所共同創造的總體情境連續地進行調整,相當於它們共同創造了一個生態並在其中不斷適應,在這樣的適應過程中,它們又不斷改變著生態。(then they adapt within an 「ecology」 they together create. And in so
adapting, they change that ecology.)如果我們廣義地使用「演化」這個詞——我將其解釋為各元素不斷調整以適應其共同創造的情境——那麼在建模的構造過程中「演化」的概念自然而然就出現了,而不需要作為補充另行添加上去。(當然在具體的例子中我們需要明確地定義我們所說的「元素」、「適應」、「狀態」和「情境」是什麼意思)因為非均衡經濟學就其本質而言是演化的,比起19世紀的物理學,它更像是現代的演化生物學。

基於代理的、非穩態的經濟學也是對均衡經濟學的一般化。非均衡系統可能收斂到或者展現出一致的模式——不需要進一步的調整,這時標準的均衡行為就成了一種特例。這樣一來,非均衡經濟學並不與均衡理論存在競爭關係,它只是一種對經濟學更一般的、生成性的研究方法。

到目前為止,我闡述了一種新形式的經濟學正在誕生——一種生成性的、非均衡的經濟學。如果讀者接受這一點,自然會問這意味著什麼。當我們研究非均衡經濟學時會有哪些新的現象?是否存在均衡經濟學無法解答的問題,能夠被這種更加一般化形式的經濟學所解答?或者按照庫恩式的說法,這種新的範式是否消解了某些異常?

對於最後一個問題的回答是肯定的。在這篇文章的剩餘部分,我將要考察在均衡經濟學中的兩種特有的異常——更準確地說是兩種不確定性——以及它們如何在新的研究方法下消解。在這過程中,我想要指出在新的研究方法下出現的一些特有現象。討論將主要基於Lindegren的一項研究以及我已經多次論述到的三個主題,因為這將直指我的論點(也因為我對這些比較熟悉)。當然,在我們的討論範圍之外還有其他研究擴展了基於代理的經濟學的界限,我想這些研究應當同樣支持我在這裡做出的論斷。

恆新

請允許我從在這種經濟學中我們常常觀察到的一個現象說起,即不存在均衡,而是始終變化的、恆新的行為。例如,我們可以看看Kristian Lindgren(1991)中的經典研究。Lindgren組織了一場計算機化的競賽,各種策略隨機兩兩配對進行重複囚徒困境博弈。在他的研究中的元素不是人類代理而是各種策略。表現好的策略將會複製並變異,而屢屢失敗的策略將會死去。策略可以通過利用自己和對手過去更深層次(using
deeper memory of)的行動來「深化」。顯然,一種策略的成功取決於各種策略當前的總數分布(population),因此如上文所述適應情境的元素——也就是不同的策略——將會對它們共同創造的競爭世界作出反應或相應地發生變化。

通過這場計算機化的競賽,Lindregen發現開始時使用的簡單策略在一段時間內未逢敵手,「以牙還牙」和其它一些簡單策略主宰了競賽的開始階段。隨後,深化的策略出現,成功地勝過了這些簡單策略的組合;不久更加深化的策略又打敗了深化的策略,依此類推,直到有些策略變得「太聰明」——也就是說,太過複雜——這時反而被簡單的策略打敗。在各種策略相互鬥爭的這個計算機世界中,Lindgren既觀察到數量龐大的多種策略共存的時期,也觀察到只有極少策略的時期;他觀察到由簡單策略主宰的時期,也觀察到深化策略主宰的時期。但這個過程從來沒有停下,Lindgren所使用的策略集在這個恆新的世界中不停地演化。這與我們在均衡經濟學中所熟悉的東西都不同。不過,這種充滿了未知、突發、複雜的策略集的動態過程是有現實意義的,比如大師級的國際象棋比賽就已經演化了數十年而且將持續下去(Chess play at the grand master level evolves over decades and never
settles down.)。Lindgren的系統非常簡單,帶來的卻是一個無盡地展開、演化的動態過程。

一般來說,我們何時能夠在經濟體中觀察到這種恆新的行為?並沒有確切的規則,但泛泛而言,在兩種情況下會出現恆新的現象。一種是系統中存在「阻挫」(這是一個物理學術語),大致意思是不能夠同時滿足所有代理(或者元素)的需求,因而這些代理需要連續不斷地爭奪需求被滿足的機會。另一種情況是允許探索和無限制地深化學習——能夠對它試圖理解的這個系統調查得越來越深入,這種情況下共同行為將不斷地探索到新的領域,領域之間可能相互複雜化,也可能相互簡化(explore into constantly new realms, sometimes mutually complicate,
sometimes simplify,),但是不會穩定下來。

均衡的不確定性和選擇的過程

Lindgren的研究並沒有出現均衡的情境,而是處於一種恆新的狀態。但在別的研究中,均衡是可能出現的,但可能不止有一種自洽的自然模式,也就是說有多個均衡。當存在正反饋或是報酬遞增時——或者更嚴格地說,在非凸時——自然會出現這種情境,這時多重均衡才是常態。乍一看這好像對於均衡經濟學並沒有造成任何重大困難,只不過是沒有獨一無二的均衡而是有多個均衡罷了。但困難確實是存在的,均衡經濟學可以找出自洽的模式,但不能告訴我們應該選擇哪一個。標準經濟學因此面臨著一種不確定性。

這種不確定性多年以來一直是經濟學的尷尬之處。Schumpeter在他1954年的書中寫道:「多重均衡並不總是無用的,但是從任何精確科學的立場上說,存在唯一確定的均衡毋庸置疑是最為重要的,即使我們需要以做出非常嚴格的假設作為代價來獲得這一均衡;如果無論怎麼抽象,都不能夠證明存在唯一確定的均衡或者至少只有少數幾個均衡,所有現象只會是一場不能夠分析控制(under
analytical control)的混亂。」面臨這種潛在的「混亂」,經濟學的不同子領域選擇了不同的方法。有些方法——尤其是在二十世紀六七十年代的博弈論中——是添加限制性(並且在一定程度上人為)的假設直到只剩下唯一的解。其它方法則與Schumpeter背道而馳選擇接受這樣的混亂。它們只是靜態地確定了問題中所有可能的均衡,而如何選擇均衡這個問題仍舊懸而未決。其中一個例子是Helpman和Krugman(1985)的國際貿易理論,其中允許存在報酬遞增,並滿足於不確定的多重靜態均衡。

我認為,一個更自然的方法是生成性地解決這個問題(Arthur 1989, 1994):不是把這個問題看作均衡如何選擇的問題,而是均衡如何生成的問題。經濟活動可以量化成(quantized)無法預測的微小事件,這些「隨機」小事件——在飛機上誰坐在誰旁邊、誰在何時提出一份邀約、誰在何時採用怎麼樣的產品——可以隨時間積累並在正反饋下放大,最終決定哪個解會被達成。這說明多重均衡的情境應當通過觀察那些事件隨時間——隨均衡生成過程——發生來建模。也就是說,最好的建模方式不是靜態的決定性的問題,而是帶有隨機事件的動態過程,並自然伴隨(natural)有正反饋或是非線性性。用這種方法,多重均衡的情境就可以通過「觀察」根據理論相應的過程如何展開來「選擇」或確定一個結果。有時一種均衡會出現,有時(在相同的條件下)則會出現另一種。儘管不可能提前知道在給定的過程展開時會出現哪種可能的結果,但我們可以研究某一特定的解在給定的初始條件下出現的概率。這樣選擇問題可以通過對情境如何生成建模來解決,即將其轉變為帶隨機事件的動態過程。通過這種非均衡的研究方法,異常就消解了。

在這個意義上,經濟學所有涉及報酬遞增的問題都應當使用非均衡的研究方法,這可是個不小的範圍。報酬遞增出現在經濟地理、金融、市場經濟學、經濟發展、技術經濟學、貧困經濟學等各個領域;這些領域的文獻也非常龐大。有趣的是,大多數重要的研究都是解析的而非計算的,因為大部分報酬遞增問題的代理都足夠同質,可以用解析的方法解決。

無論是怎樣的主題,報酬遞增研究都表現出一些共性:有多個潛在的「解決方案」;實際達成的結果無法提前預測;「選擇」受小事件影響;往往會被鎖定(it is 「selected」 by small events; it tends to be locked in);不一定是最有效的;依賴於歷史路徑;即使問題是對稱的,結果常常不是對稱的。這些性質同樣出現在另一個注重模式生成的學科:固態物理學。經濟學家用的術語是多重均衡、不可預測性、鎖定性、無效率、歷史路徑依賴和非對稱性,物理學家用的術語是多重亞穩定狀態、不可預測性、鎖相或鎖模、高能基態、非遍歷性和對稱性破缺。其中一些性質可以用靜態分析來確定(多重性、可能的無效率、不可預測性和鎖定性),但要看出這些性質的成因,以及分析對稱性破缺、均衡選擇和行動的路徑依賴,必須觀察解是如何形成的——即通過非均衡的途徑。

預期的不確定性和歸納行為

多重均衡導致了靜態經濟學的一種不確定性,預期則導致了另一種不確定性,這同樣需要通過非均衡的方式來解決。下面我來詳細解釋一下。

所有的經濟行動都依賴於對於某些結果的預期。在許多情況下,這種結果是共同確定的——它依賴於其它人選擇的行動。因此,企業家對於今天是否要投資興建新的半導體製造工廠的決定,是基於他對於兩年內市場上供給數量的預測的。他的競爭者將會做出相似的決定。但只有他們今天所做選擇的共同結果,才最終決定了兩年內的總供給(以及價格和利潤)。

在這樣的情況下,代理先試圖預測結果將會是怎樣,而他們基於預測做出的行動最終決定結果。所以這種情境是自指涉的:代理試圖形成對於結果的預測,而這個結果恰恰是由他們的預測決定的。或者更進一步地說,他們對於預期的選擇依賴於他們對於預期的選擇。如果不添加更多的條件,不存在符合邏輯的或者演繹的方式來做出這個自指涉的選擇。這是靜態經濟學一個根基性的不確定性。

我們當然可以認為這是一個無足輕重的異常,然而引發這種不確定性的情境遍布整個經濟學中:只要一個代理的決定影響到其它代理,這種不確定性就會發生。它迫使經濟學面對這樣一個缺陷——在多代理情境下預期是如何符合邏輯地形成的。這也是經濟學家對於包含預期的問題感到棘手的主要原因。

靜態經濟學理論當然也處理包含有多個代理預期的問題;它已經發展出一套理論性的方法——一種解析的方法——來解決這類問題:理性預期。理性預期考慮的是,在給定的經濟學問題中,怎樣的預期模型(如果所有人都採用它)能夠引導代理選擇平均意義上(on
average)支持該預期模型的行為。如果這樣的模型存在,代理的預期將在平均意義上符合這一模型(agents』 expectations
would be on average upheld),這就解決了選擇合適的預期的問題。

事實上,這最後的斷言下得太早了。更加嚴謹精確的說,如果這樣一個模型存在,它將會給出至少一套和結果保持一致的期望。但這是否能夠轉化為一套與現實相符的預期生成理論則是另一個問題,即使是這條路徑的支持者也能感受到這個問題非常困難。給定問題的解如果想要在一次性、非重複的問題中達成,我們需要假定代理能夠提前推斷出怎樣的模型是可行的,而且所有人「知道」將會使用這個模型,而且所有人知道所有人知道將會使用這個模型,依此類推。(這就是共同知識假設。)我們還需要進一步要求存在唯一解,否則代理可能在不同的預期上達成協調(agents might coordinate on different expectations)。

結果是,除非代理們有理由恰好在某一套期望上達成協調,理性預期將成為理論奇點:它們就像一根鉛筆靠筆尖直立起來——邏輯上可行但現實中不太可能。當代理不同時情況更糟,他們需要形成對於結果的預期,但結果卻依賴於他們不了解的其它人的預期(They must now form expectations of an outcome that is a function of
expectations they are not privy to.)。無論在行為上還是在理論上,除了一些顯然是協調的預期之外,不確定性幾乎是無法避免的。演繹均衡經濟學因此面臨著困境。

作為一種預期生成理論,理性預期在情境隨著時間重複發生時看起來更好,因為我們往往假定代理們隨著時間能夠「學習」而獲得平均意義上正確的預期。在這種情況下理性預期能夠至少形成一個解,使得預期收斂到這個解上。但我們能夠在經濟學中構造出一些情境,此時理性預期無法再充當我們的嚮導——事實上它註定會失敗。我們來看El Farol酒吧問題(Arthur 1994)。每周,一百個人必須獨立地決定是否去他們最喜歡的酒吧(比如說Santa
Fe的El Farol酒吧)。規則是,如果有人預測超過60個人會參加,她將會選擇躲避人群留在家裡;如果她預測少於60人參加,她將會選擇去酒吧。我們立刻可以看出上文所述的自指涉:代理是否參加取決於他們對於有多少代理會參加的預測。

理性預期在這種情況下是否可行?假設某一時刻它們是可行的,而且每個代理都有一套理性預期預測機器。這樣的機器將會根據給定的參與歷史(比如過去十周的)給出下一周參與情況的預測,根據定義它應當在平均意義上預測正確。假設現在機器預測下一周74個人會參加,但如果所有人都知道這一點,那沒有人會參加,與預測不符。假設機器預測下一周44個人會參加,那100個人都會去,再次與預測不符。在El Farol,共同分享的預期將會否定自身,因此平均意義上與結果相符的預測並不存在,也不能在統計意義上通過演繹得出。作為一種預期生成理論,理性預期在這裡大敗而歸,不確定性此時依然存在。演繹推理出適用於所有情況(applies
to all)的合理預期理論的任何嘗試都將迅速被挫敗。

只要我們選擇一種生成性的研究方式,並在形成過程中觀察預期,這個案例(以及一般情境)中的異常將自行消解。要做到這一點,我們可以假定開始時每個代理都有多種預期理論或者預測假說,它們都不一定是「正確的」。我們假定這些預期是主觀給定的(subjectively
arrived at),因而是不同的。我們還假定代理們像統計學家那樣行動:他們逐一測試這些預測模型,保留成功的模型並排除其它模型。這就是歸納行為,它不假定存在先驗的「解」,只規定去學習成功的(sets out merely to learn what works.)。這樣的研究方法對非均衡問題(預期不需要和結果保持一致)和均衡問題都適用;而且它廣泛地適用於帶預期的多代理問題。(參考Holland et al.(1986)和Sargent(1994))

將這種做法在El Farol酒吧問題中付諸實踐,假定代理們獨立地生成一系列預測假說或模型,然後每周他們根據當前最精確的模型(被稱為「活躍預測器」)行動。這樣不同的信念或假說在他們創造的這個生態中展開競爭。計算機模擬顯示,平均的參與人數迅速地收斂到60人。事實上,這些活躍預測器將自組織成一個均衡模式或者「生態」,其中平均而言有40%的活躍預測器預測超過60人,而60%預測少於60人。當活躍預測器始終按照這60/40的平均比例劃分時,各劃分中的參與成員卻是始終在改變的。這樣一個強均衡是以生態的形式出現的,而不是任何演繹推理的結果。

我在這個討論中的論點並不只是說可以構造出挫敗理性預期的問題,而是說:在多代理情境下,預期的生成給均衡經濟學引入了一個根基性的不確定性;但如果我們允許預期在非均衡下以歸納的、基於代理的方式生成,這種不確定性就消失了。預期生成將成為一個自然的過程。

如果我們將生成性的方法應用到標準問題中,預期是否常常收斂到理性預期的範式中呢?答案是不一定:有時是有時不是,取決於理性預期的範式是否具有足夠強大的吸引力(depending on whether there is a strong attractor to the rational
expectations norm or not.)。有趣的是,在同一個問題中也能同時達到兩種結果。不同的參數設定會導致不同的行為,在一種設定(相位、規則)下簡單均衡行為將會取勝,另一種設定下複雜的、不收斂的模式生成行為將會盛行。我猜測,在基於代理的模型中,這種情況是很常見的。

接著考察Santa Fe虛擬股票市場的例子(Palmer
et al., 1994; Arthur et al., 1997)。這個模型就是經典的Lucas均衡模型(1978)的異質代理版本。在這個模型中,異質的代理或者說虛擬投資者在計算機內構建了一個市場,市場中只有一隻股票參與交易。每個代理監視著股票價格,提交賣出價格和買入價格,這些價格共同決定了明天的股票價格。代理(各自不同地)選擇多種關於什麼影響市場價格(what
moves the market price)的假設,根據最準確的一種假設行動,然後以創造新假設和拋棄不準確的假設的方式進行學習。我們發現了兩條規則:如果代理更新假設的速度較慢,預期的多樣性將會降低,最終只剩下同質的理性預期規則。理由很簡單:如果大多數投資者的信念接近於理性預期的推測,它將具有很強的吸引力;其它的假設由於偏離理性預期將會失敗,並且緩慢地通過學習達到理性預期。但如果更新的速度提高,市場將會經歷相變進入一種「複雜規則」。此時它表現出一些真實市場中可以觀察到的性質,形成了由大量互不相同的信念構成的「心理」(It develops a rich 「psychology」 of divergent beliefs)而且不隨時間收斂。諸如「如果市場處於上升趨勢,則預測價格上升2%」這樣的預期規則隨機出現在假設中,並在短時間內互相增強。(如果足夠多的投資者據此行動,價格確實會上升。)小團體式互相增強的預期(sub-populations
of mutually reinforcing expectations)以這種方式不斷出現和消退。這並不算是恆新,但這是這類研究中常見的現象:自增強的模式出現,鎖定一段時間(就像氣象學中的雲),然後消失。

我們也觀察到另外一種現象,在非均衡研究中同樣常見:不同大小的雪崩式變化(avalanches of change of varying
sizes)。這種現象的出現是因為個體非均衡行為不時地調整,引起了整體的變化,隨後又引起了代理們進一步的行為變化。結果是,在這樣的系統中,大大小小的浪潮式的變化如漣漪般在系統中擴散。這種現象也在虛擬市場上出現,隨著代理改變他們的預期(也許是在探索新的預期假說),輕微地改變了市場,隨後引起其它代理相應的改變他們的預期。信念的變化隨之如大大小小的雪崩般(in avalanches of all sizes)擴散到整個市場,導致一段時間內隨機的高低價波動。這種現象出現在真實的金融市場數據中,但在均衡模型中卻不會出現。一個有趣的問題是,這樣的雪崩是否展現出與物理學中的相界面有關的一種性質,這種性質稱為冪律,即雪崩的大小與它發生的頻率呈負相關關係。展現出這種現象的系統通常是非常關鍵的:它們正處於有序和無序行為的當中。我們可以推測,在某些經濟學情境中,其行為將確保結果保持在這個區域中——準確地說是自組織臨界性(Bak et al., 1988)出現的區域(ensures that the
outcome remains poised in this region—technically that self-organized
criticality (Bak et al., 1988) arises.)。

結論

經過兩個世紀對於均衡——無需調整的一致的行為模式——的研究,經濟學家開始研究經濟體中均衡的出現和模式的展開問題。換句話說,我們開始研究非均衡的經濟體。這種經濟學研究需要一種演算法式的途徑,而且它要求我們更深入地理解代理面對變化時的反應,還要注意到這些反應可能是不同的——因而代理自然也是異質的。這種形式的經濟學必然是演化的,但它既不與均衡經濟學產生競爭,也不是標準經濟學理論微不足道的補充。它是一種更加一般化的、非均衡的經濟學研究方式,標準均衡行為成為了它的一個特例。

在非均衡的角度下,經濟體不再是確定的、可預測的、機械的;相反,它是過程依賴的、有機的、演化的。經濟模式有時可以簡化成一個簡單、同質的標準經濟學均衡,但常常並非如此,而是不斷變化、呈現出一種恆新的行為。

一種對新的基本方法的檢驗是,它能否解決阻撓舊方法的特定的困難——或者說異常。非均衡經濟學顯然做到了這一點。在靜態研究中,均衡選擇的問題和預期選擇的問題都有很大的不確定性,這兩種不確定性的存在並不奇怪,因為它們本質上都是生成——即如何從無到有——的問題,這是無法由靜態分析解決的。這兩類問題給經濟學帶來了很多令人不滿之處,但在非均衡研究中,它們都得到了妥善的安置,連帶著它們造成的問題也相應的消解了。


這在經濟學裡面屬於"learning"這個研究領域。有點專業,有點複雜了。

簡單說,在一定良好的條件下,循環的結果是形成(收斂到)理性預期或者納什均衡。但在更一般的條件下,則沒有明確答案。

另外,循環的結果還取決於大家採用的學習方法是什麼。如果採用的是"試錯法",則集體行為很可能會表現出複雜性和混沌性。具體可參考adaptive learning相關文獻。

以上。


簡單來說,會經過一段時間的群眾自發磨合後,達到固定的分配比例,但個體對各選項的選擇是有偏好的隨機值

先佔,回家換電腦再答

--------------------------------------電腦修改版----------------------------------

在混沌狀態下,人的策略選擇的作用往是有限的。因此,所期望的結果也不完全由自己掌握。

有一個類似的問題叫「酒吧問題」

斯坦福大學經濟學系教授、聖塔菲研究所研究員阿瑟在1994年《美國經濟評論》發表的《歸納論證和有界理性》和在1999年的《科學》雜誌上發表的《複雜性和經濟學》中闡述了這個博弈。

所謂「酒吧問題」是:

在一個城鎮里,有一個酒吧。假定這個鎮里的居民,例如總共有100人都喜歡到酒吧消遣,可是因為酒吧的容量是有限的——我們假定酒吧容量是60人,如果人去多了,去酒吧的人會感到不舒服。在這種情況下,這100人如何作出決策,是去還是不去呢?

比如說,你很喜歡泡吧的感覺,興沖沖地去了,可是到了那裡才發現人滿為患,你不但飽受擁擠之苦,還不得不為一個座位等上半天,好容易等到了又沒有招待來為你拿酒水,等到酒水終於上來了,嘈雜的環境又讓你一點感覺也沒有噎噎總之,你度過了很不愉快的一晚。那麼,第二天,你還會不會去呢?

你可能會說:神哪,饒了我吧。可是轉念一想,你就會發現事情可以是另外一種樣子,昨天感覺不愉快的肯定有很多人,這些人中的大部分又肯定會接受教訓,今天不會再去了,那麼,我今天去,是不是正好可以享受一個安寧美好的夜晚呢?

可是假如你又多考慮了一層:我這麼想,可能有很多人也會這麼所以那裡還是會人滿為患,所以還是不去為好……如此下去,那麼,你到底是去,還是不去呢?

為了不讓你等得太久,還是先揭開謎底吧:

不管你有多少個心眼,在這個問題上想要作出完全正確的決策是不可能的。

這是一個典型的動態博弈問題,每個參與者或決策者面臨的信息只是以前去酒吧的人數,每個參與者只能根據以前去的人數的信息歸納出策略來。如果許多人預測去的人數多於60而決定不去,那麼,酒吧的人數將很少,這時候作出的這些預測錯了。如果有很大一部分人預測去的人數少於60,他們因此去了酒吧,則去的人很多,多過60,此時他們的預測也錯了。因此作出正確預測的條件應該是:他能知道其他人如何作出預測。但是在這個問題中每個人的預測的信息來源是一樣的,即都是過去的歷史,但每個人都不知道別人如何作出預測,因此,所謂的正確預測是沒有的。每個人只能根據以往歷史「歸納地」作出預測,而沒有其他辦法。

通過計算機的模型實驗,阿瑟得出一個有意思的結果:不同的行動者是根據自己的歸納來行動的。並且,去酒吧的人數沒有一個固定的規律,然而,經過一段時間以後,去的平均人數總是趨於60,即經過一段時間,這個系統中的人群去與不去的人數之比是60:40。儘管每個人不會固定地屬於去或不去的人群,但這個系統的這個比例是不變的。

這就是酒吧問題。對於這個問題,首先我們說,對於下次去酒吧的確定的人數,我們是無法作出肯定的預測,這是一個混沌現象。

首先,混沌系統的行為是不可預測的。對於酒吧問題來說,由於人們根據以往的歷史來預測以後去酒吧的人數—— —我們假定這個過程是這麼進行的,過去的人數歷史就很重要,然而過去的歷史可以說是「任意的」,那麼未來就不可能得到一個確定的值。

其次,這是一個非線性過程。所謂非線性過程是說,系統未來對初始值有強烈的敏感性。這就是人們常常說的「蝴蝶效應」:太平洋這邊一隻蝴蝶扇動了一下翅膀,在對岸就颳起了一場颶風。

在酒吧問題中,同樣有這樣的情況。假如其中一個人對未來的人數作出了一個預測而決定第二天去還是不去,他的行為反映在下次去酒吧的人數上,這個數目對其他人的預測及對第三天去還是不去的決策造成影響,即第三天去酒吧的人數中含有他第二天的決策的影響。這樣,他的預測及行為給其他人造成的影響反過來又對他以後的行為造成影響。隨著時間的推移,他的第一次決策的效應會越積越多,從而使得整個過程變成不可預測的。

酒吧問題所反映的是這樣一個社會現象,正像阿瑟教授說的那樣,我們在許多行動中,要猜測別人的行動,然而我們沒有更多關於他人的信息,我們只有通過分析過去的歷史來預測未來。

「酒吧問題」沒有什麼清晰的答案,就其本身來說,甚至可能也沒有什麼真正的意義。事實上,人們決定是不是去酒吧,並不取決於猜測有多少人去,而是看自己從中是否能得到效用—— —當然,如果人少一些,不那麼擁擠,效用可能會大一些;而人多造成擁擠,效用則會小一些,人多人少的影響僅限於此。更重要的是他如何評價這個效用—— —有些人會認為效用甚低,甚至可能是負的,自然就不會去;而有些人就是喜歡泡吧,哪怕擠一身臭汗也認為值得,他就會去。所以「酒吧問題」最可能出現的結果是那些更喜歡泡吧的人成為這裡的常客,而那些不那麼熱衷於此的人只是偶爾光顧,每天去酒吧的人數會略有波動,但大致會保持在一定的幅度內。

但是在現實生活中,我們都可能遭遇很多與「酒吧問題」類似的難題。這可就不是清心寡欲所能解決的了。

比如每年高校招生都會呈現出「混沌現象」,一個簡單的道理是,如果報名的人太多,競爭就會更激烈,被錄取的可能性就低。你可能達到了分數線,但在眾多報名者中,你的分數又排在後面,所以遺憾地落選,這種結果顯然是非常不利的。為了避免落到這種局面中,考生們都對以往各院校、專業的報名情況非常關心,通過各種渠道打聽以掌握這一信息,為自己的選擇作參考。

但是由於考生一般只能根據以往幾年的情況來推測當年報名的情況,與上面說的道理一樣,這種預測是不可能完全準確的,所以每年都會有很多人遺憾地成為選擇失敗的犧牲品。

現在報名制度已經有了一定改善:學生在得知分數之後,再填報志願,這樣學生可以在掌握一些確定信息(自己的分數、總的分數線等)之後作出選擇:如果你對自己的考分不滿意,或者認為自己的分數報考某個專業把握不大,還可以退而求其次,選擇分數要求低一些,而你又覺得還可以接受的專業(其實這也可能出現本想報一個冷門,但因為這樣想的人很多,於是冷門變成了熱門的風險)。當然你也可以冒險賭一把,仍然報考理想而落選風險較大的專業(如果大家都去報冷門,你正好可以如願),即使落選也是理性選擇的結果。這樣儘管不能完全避免這種混沌現象,但總算給了學生們一個理性選擇的機會。

(參考文獻:《博弈智慧》 ,白波 )


結論:會有幾成幾成的人選擇a線路,幾成幾成的人b線路。達成利益最高化的穩態,在低範圍內波動。

原因:在大範圍的選擇過程中,人們會通過自己的經驗不斷修改決定,這種行為會造成類似水面的波動,高處的水總要往低處流,比方說選擇a路線的人今天堵車了,那明天他就會選擇b路線,那麼a路線的人流量就會減少一人,在大規模的選擇中,人流頻繁選擇的利己行為會使利益最大話

要是人們不聰明的話,請參考囚徒博弈


如此循環的話,結果就是死循環咯。

覺得A線路不堵車(1)→選擇A線路(2)→別人也會選A(3)→不選A→……

題主的推理中存在錯誤:

(1)處「覺得」是個人行為,你不能保證這是個公共知識(即別人也這麼覺得),所以由(1)是不能推出(3)的。


鬱金香泡沫

當鬱金香開始在荷蘭流傳後,一些機敏的投機商就開始大量囤積鬱金香球莖以待價格上漲。不久,在輿論的鼓吹之下,人們對鬱金香表現出一種病態的傾慕與熱忱,並開始競相搶購鬱金香球莖。1634年,炒買鬱金香的熱潮蔓延為荷蘭的全民運動。當時1000元一朵的鬱金香花根,不到一個月後就升值為2萬元了。1636年,一株稀有品種的鬱金香竟然達到了與一輛馬車、幾匹馬等值的地步。面對如此暴利,所有的人都沖昏了頭腦。他們變賣家產,只是為了購買一株鬱金香。就在這一年,為了方便鬱金香交易,人們乾脆在阿姆斯特丹的證券交易所內開設了固定的交易市場。正如當時一名歷史學家所描述的:「誰都相信,鬱金香熱將永遠持續下去,世界各地的有錢人都會向荷蘭發出訂單,無論什麼樣的價格都會有人付賬。在受到如此恩惠的荷蘭,貧困將會一去不復返。無論是貴族、市民、農民,還是工匠、船夫、隨從、夥計,甚至是掃煙囪的工人和舊衣服店裡的老婦,都加入了鬱金香的投機。無論處在哪個階層,人們都將財產變換成現金,投資於這種花卉。」1637年,鬱金香的價格已經漲到了駭人聽聞的水平。與上一年相比,鬱金香總漲幅高達5900%!1637年2月,一株名為「永遠的奧古斯都」的鬱金香售價高達6700荷蘭盾,這筆錢足以買下阿姆斯特丹運河邊的一幢豪宅,而當時荷蘭人的平均年收入只有150荷蘭盾。

就當人們沉浸在鬱金香狂熱中時,一場大崩潰已經近在眼前。由於賣方突然大量拋售,公眾開始陷入恐慌,導致鬱金香市場在1637年2月4日突然崩潰。一夜之間,鬱金香球莖的價格一瀉千里。雖然荷蘭政府發出緊急聲明,認為鬱金香球莖價格無理由下跌,勸告市民停止拋售,並試圖以合同價格的10%來了結所有的合同,但這些努力毫無用處。一個星期後,鬱金香的價格已平均下跌了90%,而那些普通的品種甚至不如一顆洋蔥的售價。絕望之中,人們紛紛湧向法院,希望能夠藉助法律的力量挽回損失。但在1637年4月,荷蘭政府決定終止所有合同,禁止投機式的鬱金香交易,從而徹底擊破了這次歷史上空前的經濟泡沫。

預期鬱金香會漲——鬱金香漲——預期會繼續漲——繼續漲——預期會突破天際——泡沫破裂


有一個觀點是對系統求微分方程的均衡解。

考慮微分方程在無窮遠處的斂散性問題。

因為反饋機制可以看成某個量的變化趨勢關於某個量當前值的關係。

這個東西太複雜的我不會,線性的我可以截個圖。

這也就說明了為什麼有的時候得到穩定情況,比如有及時反饋的石頭剪子布基本上都是1/3;

也有的情況就爆炸啦,比如次貸危機。

常規理解這個的方法是通過凸規劃或者說博弈論。

博弈論裡面有兩種均衡可以解釋這種問題,最後得到一定的概率分布(竊以為是由於中心極限定理,在大樣本時會收穫一個統計意義下的概率分布。)

這裡說零和博弈:

1.納什均衡,我最大你也最大,就是一個局部極值點,ok,就是你了。

2.極大極小,就是你獲得極大的收益,我獲得極小的損失,算啦,接受啦23333。

這類判斷我記得叫博弈是否可解?等價於某一個曲面的局部性質。和前面說的微分方程的方法有較大的區別。(這裡我都是亂說的,沒看書)

舉個例子,比如石頭剪子布

每一個都1/3就是納什均衡點呀,

因為你如果策略是只出石頭和布,那麼人家出布就打爆你了嘛,所以你肯定是要考慮石頭剪子布這個策略空間的。

然後你現在有三個策略,明顯對稱的嘛,所以選各1/3。

當然我這是懶得寫公式舉個要算的例子了。。具體可見各種博弈論。

P.S. 某人上班有兩條公交的時候,他會驚奇的發現,每天每班公交上人數差不多。如果沒過節啥的。

這是為什麼呢?因為大樣本情況下人的選擇取決於其博弈的結果(不論是否考慮博弈,人心中總有一個概率形式的選擇去選A或B,並假設它們獨立且公交車每次都同時到站,不能交流)

那樣最後基本上都會有一個均衡解的,因為我記得有個定理,叫只有兩個策略的2乘2的矩陣的博弈必定有解。

我是個民科_(:з」∠)_說錯見諒2333


循環的結果就是現實世界啊。

調整會有衰減的,越接近最優解,衰減越厲害,最終接近於0。


隨口問問題主是會在超市雞蛋是買6.99的,還是7.01的呢?


好多抖機靈的,好多抄書的。

拜託各位在用博弈論之前看懂前提。

學知識重在用,不在顯擺。

做研究重在理解context,不在顯智商或秀自己的理解程度。

知乎回答重在通俗易懂、言簡意賅、深入淺出。

要理解預期影響行為,首先要理解個人與外界之間的互動關係。兩個人或少數幾個人在一起博弈,每個人的影響比較大,可以用博弈論進行分析。人數比較多的時候,博弈論往往無法求解,這是數學工具所決定的。至於為何,去讀讀混沌理論之類的書吧。因此在多人博弈時,博弈論之外的很多學科就開始發揮作用了,如社會心理學之類的。

因此對於路線選擇之類的問題,對於絕大多數人絕大多數時候來說,不必用博弈論來分析。在這種情況下,你的個人選擇很不重要,你走不走任何一條路,都幾乎不會影響任何一條路的擁堵情況。擁堵的出現不是博弈行為,是簡單的供求關係決定的。這個時候你直接根據自己判斷,認為該走哪條就走哪條。

對於所有生活中博弈論適用的情景,包括博弈論教材中經常出現的各種案例,也要活學活用。所有社會科學理論都來自於現實,所有偏離社會現實的理論預測都不是現實錯了,而是理論前提假定未必適用。比如說你真要選擇了幹壞事,就要考慮到被警察叔叔抓,面臨真的囚徒困境。那麼為何還有人自己甘願把牢底坐穿而拒不招供,那必然是為了打造真義氣這個聲譽,在這一行當深耕細作好當老大啊。再說招了後早晚會被滅口,這點機制都沒有還怎麼在道上混。按教科書來指導自己行為,特別是本科教科書,實在是圖樣圖森破。

是的,聲譽才是你需要從博弈論中學到的最重要的概念之一。由於日子總的往下過,人生就是無限期重複博弈,因此保持聲譽才能讓自己效用最大化,也讓周圍朋友效用最大化。古巴導彈危機中,美國如果沒有之前敢打大仗的聲譽、毛子如果沒有之前關鍵時刻犯慫的聲譽,這個危機的解決或許是另一種方式。情侶看電影/球賽的博弈,如果你有鐵杆球迷為了球賽啥都不顧的聲譽,你女朋友肯定乖乖的陪你看球;如果你有體貼她為了她啥也不顧的聲譽,那就去看球唄;你要是左右搖擺朝秦暮楚,你女朋友肯定早成前任了。其餘例子就不舉了,大夥自己看書去。

在更為複雜的個人與社會之間的博弈中,博弈論分析非常複雜,作為非專業人士,看多了再多沒理解也然並卵。我認為需要理解的一個重要概念就是「自我實現的預言」,簡單說就是你認為社會是公平和陽光的,那麼你就一定能從中獲益,反之亦然。社會如此複雜,你也身在其中,所以你不可能得到所謂理中客的真實描繪,因此就只能先堅信一個先驗的信仰,按照這個信仰來行事,建立某種聲譽,最終你周圍的人和事物都將回饋你一個如你所願的社會。


推薦閱讀:

為什麼中秋節要送月餅?既然送的月餅大家都不怎麼吃,為什麼還要繼續送下去?
行為經濟學國外有哪些好的教材?
我們不聰明,但我們蠢得很有規律
能否從經濟學的角度看待住院全套檢查的現象?
只思考邊際量的人是理性人嗎?

TAG:經濟學 | 行為經濟學 | 社會 | 博弈論 | 行為 |