量化大吃小

之前在能否用具體的例子解釋一下 (Model-based) Structural Estimation? - 豬月的回答提到了一篇structural form的論文,Guvenen和Smith(2014),當時學習起來確實非常吃力。如果模型設定非常複雜,則識別和估計工作非專家不能為也。不過,有時候一些看起來必須要上structural的問題,也是可以藉助一些reduced-form的思路來做簡化,然後再估計的。賈攀樂老師2008年的文章就是一個很好的例子,這篇文章當時還獲得了美國統計學協會年度最優論文獎,Zellner獎。

文章的背景來自美國社會很常見的輿論:大超市擠壓了小零售店,使後者無利可圖以至於退出市場。回憶自己的童年,社區里的小店確實承載了很多回憶。小店倒掉,引發大家的傷感也是很正常的。不過,不管爭論結果如何,哪一方在公眾眼裡的價值更高,在真正制定政策之前,我們都必須回答一個問題:沃爾瑪和K-mart這些超市的擴張,是否真的擠壓了小店的生存空間?如果真的有,幅度如何?這非常重要。如果我們想評估零售業的效率是不是在這個過程中得到了提升,我們就需要了解大超市和小商店的變遷,然後結合銷售額、利潤和成本等因素再去估算。如果我們希望從就業這一角度來制定政策,我們就需要了解大超市和小商店各自的僱員人數和結構,再針對性地制定政策。總之,不論如何,我們都應該先把最基礎的問題解決掉。從數據上看,1960-1997,這近四十年間,大型超市逐漸統治了零售業,產業份額越來越集中在少數企業手中。超市銷售額同一時期增加了13倍,而零售業總體銷售額只增加了2.6倍。這裡的超市,面積下限是25000英尺。而小零售店則用SIC(Standard Industrial Classification)界定。

在經濟學中,這一塊也被叫做進入-退出問題(the entry-exit problem),最經典的結果來自Bresnahan和Reiss(1990,1991)。在這篇文章中,我們要解決的也是這麼一個三階段的進入退出問題:整個區域被劃分成很多相互連結的市場。第一期,在沒有預料到沃爾瑪和K-mart出現的情況下,小零售店決定是否進入本地市場。這等價於小零售店考慮的效用函數中,競爭對手只有本地的其它小零售店。如果決定進入,投資成本就此沉沒。進入第二期,沃爾瑪和K-mar等大超市t出現,並考慮是否進入各個市場。與小零售店不同的是,大超市的決定是全國性的,它們可以針對每一個市場作出進入/不進入決策。因此,大超市的效用函數里會有所有其它大超市的進入決策,以及已有的零售店數量。如果還有小零售店認為自己可以盈利,在第二期也可以進入市場。最後,在第三期,小零售店決定是否退出。

文章中,作者將研究的終點時間設定在1998年,這有兩個好處。其一,在1998年之前,美國超市中的另一股力量——Target還未崛起,門店主要分布在大城市。而作者將研究範圍限定在了超市和零售店競爭最激烈的中小城市,從而簡化了問題。我們只需要考慮沃爾瑪,K-mart和小零售店之間的競爭。其次,2000年以後的全國超市名錄有顯著的錯誤和缺失。也不適合研究使用。不過,即使將大超市限制到只有兩家,問題依舊很棘手。為更精確地估計這個進入——退出問題,作者將研究範圍進一步限制到全美人口在5000-60000的郡之間。小於這個規模的郡不太可能成為大超市的市場,而大於這個規模的郡已經可以稱作城市了。這樣的郡常常可以再劃成幾個小部分,每一部分有各自的超市和零售店。因為我們要考慮的是每個市場上的進入-退出問題,而在一個城市內部劃分出特定的市場範圍非常困難,所以作者也放棄了這一部分數據。此外,美國零售店名錄里的數據也只精確到郡,更加精細的數據就完全沒有了。

我們可以先打量一下我們即將要估計的這個問題。本質上來看,這是一個三階段的博弈。得到第一階段的解是相對簡單的,如果我們能夠得到小零售店預期的利潤函數,直接讓這個函數大於0就可以得到利潤函數的決策。同樣的道理也適用於第三期,因為此時一切已成定局,唯一需要做的決定是否退出,如果已經有了利潤函數,只要已知第二期的情況,一切都可確定。解這個問題的關鍵難點在第二期大超市的進入決策。首先,這裡的總策略數量是個天文數字。即使作者已經把待研究的市場壓縮到了人口在5000-60000之間的郡,這樣的郡也有2000多個。每家超市需要單獨決定是否進入某個市場,這等價於決定一個2000維的向量,每一維有兩個取值,不妨直接設做0和1。也就是說,兩方每一方的策略都有2的2000多次方個。因為我們這裡是要做定量估計的,這麼大的策略空間,會給參數估計帶來巨大的麻煩。其次,相互依賴也是個大難題,雖然小零售店的決策純粹基於本地市場,大零售店肯定是全國布局的。以沃爾瑪為例,它在全國投放的廣告可以共享、採購可以共享、關於地方市場的信息也可以共享,一定範圍內更多的沃爾瑪可能會促進彼此的生意。但是,一定範圍內太多的超市又可能引起相互競爭,這又會導致彼此之間相互妨礙。此外,互相依賴本身,也會導致一些常用的估計量,如MSL(the method of simulated log-likelihood)和MSE(method of simulated moments)不一致,還需要做調整。

作者的解決方法非常精彩。首先,我們要設定一個適於估計,但又包含了所需變數的利潤函數。在第一期,作者設定小企業的利潤函數如上所示:右邊第一項是一些反映市場容量,如人口等的變數及其係數,符號由估計得到。第二項是競爭效應,對數符號里的變數是當期進入的小企業數量,前面的係數理論上應該是負號。第三項和第四項分別代表行業利潤衝擊和個體利潤衝擊。兩者都可以被店主觀測到,但無法被我們觀測到,所以需要估計。行業衝擊是一正態分布的隨機變數,同時影響所有店鋪,且在各時期內獨立同分布;個體衝擊在各地區獨立同分布,也被假設為正態的。這些假定在最後的估計中都可以放鬆。作者在在線發表的附錄中進一步討論了一般分布情況下的估計,結果和此模型差別不大,我們就不再贅述了。總之,第一期中小零售店店主進入等價於上式大於等於0。

利用類似的設定,我們可以寫出第二期的利潤函數。這裡用i記超市,取k和w兩個值,k代表K-mart,w代表沃爾瑪。用兩值變數D代表各超市在不同市場的決策,1代表進入,0代表不進入,則上圖中上面的式子代表超市在特定市場的利潤。因為進入才有利潤,不進入利潤為0,所以括弧外面有個乘積項。括弧內第一項仍是反映市場容量的變數及其係數,第二項則是進入決策本身的係數。這個係數反映了平均意義上進入能夠給超市帶來多少利潤。第三項的意義在和之前相同,加上1是為了防止式子取0,利潤無定義。第四項非常關鍵,反映了各個超市之間的相互影響。具體來說,這一項前面的係數反映了鄰近超市之間相互影響的大小,加和號內部則是用距離加權過的附近超市的數量。如果在距離這個地方20公里外的郡有一個沃爾瑪,40公里外又有一個沃爾瑪,則加號內部的值取1/20+1/40。這一項在50公里處截斷,原因有二,一是如果不這樣處理,估計量可能發散;二是根據實證研究,人們很少開車到20公里以外的地方購物。這為截斷處理提供了支持。沉沒成本和行業衝擊項含義和之前完全相同,而個體衝擊則有一些差異。具體來說,作者假設兩期中企業面臨的個體衝擊未必相同,而企業受到的實際衝擊是兩期衝擊的加權和。這一設定主要是為了反映某個市場上有可能發生的系統性偏向大/小商店的衝擊。利用一模一樣的方法,我們可以寫出第三期的設定。把其它項目全部簡寫成X,保留D,我們得到了以下收益函數。在這篇文章中,為了求解,作者直接假設了theta>=0。這對於後面簡化問題至關重要。考慮到1998年超市的密度,作者認為這一假設是合理的。

這幾段會稍微涉及一點數學的內容,只對結果感興趣的可以直接跳過看最後兩段。在估計之前,先要在前面給定的收益函數下解出博弈的納什均衡。直接遍歷策略函數求解肯定是不現實的,畢竟,策略數量已經超過了10的600次方個。這個函數很明顯也不是凸的,所以凸優化的一些技巧也無法運用。為解決這個問題,仔細觀察策略空間,我們發現,如果恰當地定義大於關係和小於關係,這是一個偏序集(poset)。這裡的大於定義為一個向量的所有元素都大於等於另一個向量的所有元素,並至少有一個不取等號。類似地可以定義小於、大於等於、小於等於和等於。再檢驗最小上確界條件和最大下確界條件,我們可以發現,這是一個有限格(finite lattice),這是非常非常美好的性質。我們再考慮納什均衡本身的性質,均衡意味著雙方面對對方的策略都是最優反應,這意味著在每一個市場偏離現有策略都是無利可圖地。再進一步,這意味著把任何一個0換成1,或者1換成0,都無法為超市帶來更多的利益。於是,注意到下圖中的映射,可以構造如下必要條件:某一策略D是最優反應僅當它是如下映射的不動點。又因為這個映射在我們定義的格上是單調增的,我們可以運用Tarski定理。這一定理指出:將一個有限完備格映到自身的增函數必有不動點。這些不動點也構成一個有限完備格,存在最大元和最小元。

注意到以上的分析對雙方都成立,由於雙方的策略空間都是lattice,這裡可以引入超模函數(the supermodular function)了。考慮沃爾瑪的策略空間Di,K-mart的策略空間Dj,根據上一段的分析,前者是一個偏序集,後者是一個格。於是,我們可以使用Topkis定理,將Dj做一個簡單的變換換成-Dj後,我們發現前面定義的沃爾瑪的收益函數本身就是(Di,-Dj)上的一個超模函數。用類似的方法可以得到K-mart的收益函數也是(-Di,Dj)上的一個超模函數。使用經典的Milgrom-Shannon定理可以知道這樣的超模博弈中必存在納什均衡,且全體納什均衡構成的集合中有最大元和最小元。利用這一點就可以直接求解了。

求解使用經典的迭代方法(Round Robin)。首先,我們假設沃爾瑪在所有市場都選擇不進入,接下來計算K-mart的最優反應。利用第一輪求出來的K-mart的最優反應,接下來又可以計算沃爾瑪的最優反應,依此類推,直到收斂為止。利用前述的Milgrom-Shannon定理可知這一演算法必定收斂,再檢查定義可知收斂結果必然是納什均衡。由於兩個最優反應函數都是單調的,假設一共有M個市場(實際是2000多個),每個市場有N種策略。運用這種方法,即使運氣最壞最壞,也不過只需要計算M*N次。而回憶我們一開始討論的優化問題,複雜度很明顯是指數級的。在這裡,作者等於是利用超模函數,把實際估計的計算量從指數級直接降到了線性時間。此外還可以證明,從沃爾瑪不進入市場開始迭代,最後收斂到的均衡是所有均衡中對K-mart最有利的;從K-mart不進入市場開始迭代,最後收斂到的均衡是所有均衡中對沃爾瑪最有利的。且這兩個均衡分別是納什均衡集合的最大元和最小元。作者在文中還進行了三種均衡的穩健性檢驗,前兩種就是我們剛剛提到過的,沃爾瑪最優均衡和K-mart最優均衡。第三種均衡則考慮了歷史因素,在歷史上,沃爾瑪在阿肯色州附近等幾個區域發展最早,最強勢;K-mart在另外幾個地區有傳統優勢。作者考慮了這一點,假定這些超市已經進入了傳統優勢區,然後再開始迭代。結果發現參數對選取何種均衡並不敏感,結果相當穩健。平時識別博弈問題時的大難題——多重均衡,在這裡得到了很好的解決。第二步解出以後,第一、第三步都可以直接計算。

接下來就是估計了。前面有提到,面對這一類問題,傳統的估計方法主要是MSL或MSE。作者在這裡首先運用MSE進行了估計,矩條件是E[g(Xm,theta)]=0,其中theta是參數,而g是衡量真實數據和模型預測數據距離的函數。於是,構造MSE等價於尋找上面的最優化問題的解。然而,由於各個市場間超市的決策是相互依賴的,在估計的時候,我們需要用Conley的方法去修正矩估計中得到的協方差矩陣,這一修正的原理類似於我們學習的GFLS方法,表達式如下。作者一開始假設超市的協同效應在50公里處截斷就與此有關,如果不做截斷,協同效應可能會沒有上界,從而無法得到相應的估計量。除了尋找實證數據支持外,作者還針對不同的截斷距離做了穩健性檢驗,發現沒有顯著差別,說明這個截斷距離也是穩健的。作者在給出估計結果之前還討論了很多其它因素,比如不同的模型設定、非正態衝擊、引入小零售店的異質性以及考慮異方差等等。由於這篇文章根據作者博士論文的第一章改編髮表,更多討論需要參見作者的博士論文原文。

最後便是估計結果。關於市場的幾個變數,比如人口數量、人均購買力以及城市人口比例,符號都顯著,符合預期方向。其它參數估計方面,具體估計結果請參見原文,幾乎所有結果在幾種穩健性檢驗下都保持穩定。最令人驚異的是,根據模型得到的參數預測,幾乎完美地擬合了現實情況。注意下面給出的截圖,雖然作者估計的模型對小零售店的平均數量預測有些許差異,但對沃爾瑪和K-mart的擴張數量的預測是完全準確的。至於大家最關心的問題:大超市在多大程度上影響了零售店的經營發展,作者也給出了答案。具體方法是:先估計出我們前面給出的三階段博弈模型的參數,然後做反事實模擬。比如說,我們想看看如果沒有大超市進入,零售店會怎麼發展,那我們可以在估計出所有參數後直接將第二期超市的進入拿掉,只考慮零售店本身的決策和外部衝擊。如果我們想看看沃爾瑪和K-mart的競爭有多麼激烈,也可以採用類似的方法,假設沃爾瑪根本不存在,看K-mart第二期會如何發展;或者假設K-mart不存在,看看沃爾瑪會如何發展。

下表是針對超市和零售店之間競爭的一些估計結果。表中左邊一欄是沃爾瑪/K-mart進入對小零售店利潤造成的直接影響,表明在超市進入後還能獲得正利潤的零售店比例,右邊一欄則是能回本的比例,不但要求利潤為正,還要求利潤能夠補償進入成本。以1988年估計結果為例,最上面一行是假設沃爾瑪和K-mart都不存在時的估計結果,此時所有零售店都不受影響,繼續經營。接下來是假設只有K-mart出現在市場上結果,此時只有82.7%的零售店還能掙錢,47.1%的零售店能回本。最下面一行則是現實的估計情況:如果沃爾瑪和K-mart都進入市場,只有62.7%的零售店能獲得正利潤,三成出頭的零售店才能回本。到了1997年,小零售店的情況稍微好了一點,有72.4%的比例能夠賺錢,36.5%的零售店能夠回本。如果使用現實數據,27.6%的便利店虧損意味著每個郡有1.1家便利店不賺錢,63.5%的零售店無法回本,意味著每個郡有2.9家便利店面臨關張窘境。我們還可以估計沃爾瑪和K-mart之間競爭的激烈程度。在1997年,如果K-mart不存在,沃爾瑪會多進入將近三成(28.8%)的市場,如果沒有沃爾瑪,K-mart會額外進入72.8的市場,也就是說K-mart會從實際存在的328間上升到理論上的558間。最後,利用我們已經得到的進入-退出結果,我們還可以評估政府補貼的實際效果。作者計算了超市僱傭的勞動數量和零售店僱傭的勞動數量,認為對零售業企業補貼在創造新勞動崗位方面效果不明顯,補貼很可能是無效率的。

這篇文章到這裡就基本上結束了。作者還討論了很多話題,比如說人口和城市的擴張可能的效果,超市的協同效應,以及這篇文章理論和實證上許多可能的擴展,具體請參見原文/在線發表的補充材料/博士論文。這篇文章先巧妙化簡一個複雜的模型,再用超模函數大大降低求解的複雜度,最後再用精心搜集的微觀數據估計,調整估計量,做出了幾乎和現實完美符合的預測。這應該可以算是實證論文里做得最好最好的那種了,個人也非常喜歡這篇文章。

參考文獻:

Bresnahan T F, Reiss P C. Entry in monopoly market[J]. The Review of Economic Studies, 1990, 57(4): 531-553.

Bresnahan T F, Reiss P C. Entry and competition in concentrated markets[J]. Journal of Political Economy, 1991: 977-1009.

Conley T G. GMM estimation with cross sectional dependence[J]. Journal of Econometrics, 1999, 92(1): 1-45.

Jia P. What happens when Wal-Mart comes to town: An empirical analysis of the discount retailing industry[J]. Econometrica, 2008: 1263-1316.

Jia P. 「Supplement to 『What Happens When Wal-Mart Comes to Town: An Empirical Analysis of the Discount Retailing Industry』,」 Econometrica Supplemental Material, 76, 2008.

Milgrom P, Shannon C. Monotone comparative statics[J]. Econometrica, 1994: 157-180.

推薦閱讀:

2017年商品专员的出路在哪里?
水果行業零售終端的發展方向和前景?
新零售到底是何方神聖以及該怎樣去應用它
香港會是內地城市商業的未來嗎?

TAG:经济学 | 计量经济学 | 零售行业 |