標籤:

再談「把實證研究進行到底」

本期推送節選自作者在「截面和面板數據分析」一課上的第一講,具體如下:

資料來源@中國經濟學教育科研網

再談「把實證研究進行到底」

陸銘

上海交通大學安泰經濟與管理學院特聘教授、博士生導師

「就像在吃一條魚的時候,就看到魚肚子很肥,但你們不知道在做這項研究之前和之後有很多的工作要做,而這個之前和之後的工作往往佔到70%的時間,但你們就看到這個中段,就是paper本身。」陸銘教授認為在實證研究和理論研究時,學生往往比較容易關注到中段,但對如何做好實證研究的前期工作不得要領。

那麼, 如何做好一項實證研究?為什麼實證研究在中國特別重要? 今日,中國經濟學教育科研網推送陸銘教授《再談「把實證研究進行到底」》一文的後半部分內容,涉及實證研究紮根中國的重要性,以及做好一項實證研究的具體「實操」方法。「讓我們的經濟學研究走向現實,讓我們將實證研究進行到底。」

實證研究和中國經濟學的發展有怎樣的關係?

首先,我剛才已經舉了很多的例子來告訴大家,實證研究在很多領域裡面它是研究的前沿。那麼,實證研究在哪些領域裡面構成前沿呢?第一個在勞動經濟學裡面,實證研究在上世紀九十年代以後變得越來越重要,因為勞動經濟學是一個典型的學科,它的理論已經基本上趨於完善了。所以,在九十年代以後,如果你說你是一個勞動經濟學家,基本上大家就會把你理解為是一個應用微觀計量經濟學家,而不是理論經濟學家。這個學科的發展已經到了一個以實證為主的階段。

第二個就是我剛才講到的兩個例子,在產業組織和人事管理經濟學裡面,這些學科是從理論開始發展的,但是在它的理論大發展的時候,由於數據的公開性問題和數據的成本問題,經驗研究非常少。而現在這些年,經驗研究在這些領域裡面構成了前沿研究領域。

第三個就是在很多的研究問題裡面,我們根本就不知道事實是怎麼回事。我們都能體會到,中國經濟的發展、中國的制度、文化、人的行為,包括社會和政治的結構,跟現在經濟學裡面學到的一些東西不太一樣,我們都模模糊糊地知道不太一樣,但是從經濟學研究來講,我們實際上缺乏可以被經濟學科學研究所確認的差異到底存在不存在?如果存在,到底有多大?我們不知道。所以現在大量的對於中國問題的理解,我們仍然是基於在西方的事實基礎上所發展出來的理論來研究和理解中國的事實,但這樣做,在很多時候我們就會對中國的問題看不透。如果你要提出一個對於中國的理解,構建一個新的理論的話,首先要做的就是,確實我們需要一個新的理論,因為我可以告訴你,在經驗研究上它是有差異的。

我特別想強調實證研究在中國特別重要的幾個理由:第一個是我剛講到的,中國有一點不一樣,但是什麼地方不一樣?事實還不是很清楚。第二是制定政策的需要。在中國現在所處的經濟發展階段,我們還沒有足夠的資源去養一批經濟學家,他們可以不關注現實問題,就在書齋里讀書,寫paper,做所謂的純理論。中國現在所處的階段對應用研究的需求一定是非常大的,對此,非常重要的就是我剛才講的policy evaluation,基於實證研究的政策評估。

大家知道中國政府現在都講科學決策,什麼叫科學決策?在英文裡面沒有一個詞叫scientific policy making的,但英文有一個詞叫research-basedpolicy making,我覺得這就是科學決策的英文翻譯,我們現在講科學發展觀,也就是要多做研究。此外,中國的實證研究也是國際關注的焦點和趨勢。以後你們有機會去參加會議,特別是國際會議裡面關係到中國問題的會議,你就會發現,經驗研究所佔的比重是絕大多數。這就反映了經濟學家意識到經驗研究對於這些問題而言是我們首先需要做的工作。比如上學期期末的時候,我的學生張爽和我的文章被廈門大學一個非常高規格的勞動經濟學的會議接受,因為是洪永淼教授組織的,請了很多大牛,包括Heckman,諾貝爾得主級別的。有人在會上說,我們到了中國來就是希望知道中國在發生什麼,可是我們沒有聽到這個。所以,我們在中國做研究,首先要做的還是踏踏實實地告訴大家,中國到底在發生什麼樣的事情?在這個基礎上如果要是發現有差異,那麼我們就需要新的理論。

最後,由於前面三點,它就會關係到你的資助(funding)。你要去爭取一些項目,包括國際的一些項目,都涉及到funding問題。

如何完成一項實證研究?

實證研究和理論研究一樣,對於我們的學生來講,往往比較容易關注到中段。就像在吃一條魚的時候,就看到魚肚子很肥,但你們不知道在做這項研究之前和之後有很多的工作要做,而這個之前和之後的工作往往佔到70%的時間,但你們就看到這個中段,就是paper本身。那麼對於實證研究來講,之前需要做什麼呢?

首先,在你做實證研究之前,你要有一個great issue(大問題)作為你的研究背景。這就是「大處著眼」的問題,但是你必須要有一個small point,也就是我經常講的「小處著手」的問題。有了一個great issue就使得你的研究重要,而有了small point又使得你的研究具有可操作性。之後你要有一個好問題(good question)。比如我剛講的,制度對於經濟增長到底重不重要?理論制度經濟學家就會告訴你很重要,可是對於實證研究來講,我們是不知道的。因為當你看到制度好的國家經濟發展水平也高的時候,我們其實不知道這是不是因為它經濟發展水平高了所以它有好的制度。

那麼對於實證經濟學家來講就要去看from institution to growth的這個因果關係(causality)到底有沒有,這就是一個great issue。那麼,small point是什麼呢?在Acemoglu做的研究裡面,他就想,怎麼去把這個causality確定下來呢?他找到了一個很重要的工具變數,他去看非洲、拉丁美洲等殖民地時期的自然條件,其中一個非常重要的條件就是死亡率。他的想法是,如果在那個時期這些殖民地的死亡率高的話,白人就不願意住下來,這樣他們就會採取掠奪式的制度。如果願意住下來,他們就會移植歐洲的好制度。那個時候制度的情況就會影響到今天一些地方制度好壞的差異,於是,這就很可能帶來增長的差異。通過這樣一個鏈條的作用就可以確認制定是導致增長的原因。這個做法就是一個small point使得他的研究變成了一個可操作的研究。

再接下來我舉的一個例子是tea和sex。大家知道在發展中國家,我們出現的一個非常重要的問題就是sex imbalance,女孩子太少,男孩子太多。經濟學家的一個解釋是,對於一個家庭來講,生男孩比生女孩好。因為男孩的生產率高,工資高,於是投資一個男孩的回報就更高。這個解釋很多人不太喜歡,說經濟學家從經濟學角度來解釋生育行為不對,他們覺得這就是文化的影響,大家都不喜歡女孩子,歧視女孩子。那麼經濟學家講的到底對不對呢?於是就有我剛講到的tea和sex研究裡面,有一個美籍華人叫NancyQian,她是前年的美國job market上的star,現在到Brown去了,她來過復旦兩三次。在她的研究裡面就用中國的數據來檢驗家庭生育行為是一種經濟決策。她想到,在改革開放以前,各種商品的價格都是被管制的,改革開放以後價格在逐漸放開,於是經濟作物特別是茶葉的價格上漲了。大家知道摘茶葉這件事是女孩子的比較優勢,因為女孩子比較細心。那麼,根據經濟理論的推斷,茶葉的價格上升就會導致女孩的回報提高,這樣就會使得家庭更加願意生女孩,就會在孩子出生以後給女孩更多的照顧以減少她的死亡率。於是她就用了這樣一個自然實驗(natural experiment),價格改革這個自然實驗提高了女孩的回報,於是提高了女孩的出生率和存活率,結果她的研究發現就是這樣的。

那大家可能馬上就想了,這些都太複雜了,我做不了。做不了可以做些簡單的,比如我要講一個礦難的例子,當然這個也不簡單,因為你要是研究礦難會很麻煩。但我想舉個例子,前年的經濟學年會上,有一位老師說,他觀察到中央政府要求地方政府提高礦難職工死亡的補償費以後,礦難反而增加了。為什麼呢?根據經濟理論,這有可能引起更嚴重的道德風險。如果安全措施是由經濟決策決定的,而生命是有價值的話,礦難水平提高了意味著如果減少安全措施,一旦發生事故,補償金水平提高了,這就會增加人的道德風險,降低安全的保障措施,這就有可能導致死亡率上升。問題在於,你們如果學過信息經濟學,要做出一個像我剛才講的這個故事的理論是非常容易的。可是這裡面就遇到一個問題了,他剛才講的這個故事到底是不是真的?是不是在補償提高以後礦難的發生率反而提高了?或者說這兩件事情有沒有因果關係?我們不知道的。如果你要是把這個文章做出來,一定是非常好的文章,因為它是一個大問題,它可以證明,人的生命是不是可以用價格來算的。

在你提出一個好的問題以後,一定要充分去做文獻評論(literature survey),這可以達到幾個功能:第一,通過文獻評論你可以去證實你的研究為什麼重要。比如我剛講的礦難問題,如果你的文獻評論是這樣做的:某年某月有個人說,這兩者是正相關的,所以我這篇文章就要去證明這個,那這篇文章就沒人感興趣了。如果你的文獻評論是這樣的:在經濟理論裡面有人提出,人對於安全設施的投入是一個經濟的計算,對此很多社會科學家是有爭論的。比如一些社會學家認為經濟學家的這些觀點是錯的,這篇文章通過礦難的案例來告訴你經濟理論是否正確。人家就會覺得非常重要。

第二個你要做的工作就是,要說明what』snew?我們做研究最容易忽略的就是what』s new。你做一個東西出來,你的讀者為什麼要看?你一定要在做的過程中想辦法在你的東西里挖出一些新的東西來吸引你的讀者,因為看文章對於每個人來講都是有成本的。我們很多同學以為,我做了一個偉大的工作,但我不說,我很酷。我告訴你,如果現在做研究就抱著這樣的心態,你死定了。你做一項研究,你一定要竭盡全力地要把你的工作在idea,method,data這幾個方面跟既有的研究去做比較,來告訴大家,我用了一個不同的idea,我用了一個不同的方法,我的方法能夠得到更加準確或者unbiased的估計。我的data是新的,別人的樣本很小,我的樣本大,別人沒有這個度量,我有這個度量,所以我新。

再來談研究之中,這個時候你首先需要一個理論。我剛才已經講過了,這個理論和分析框架涉及到的第一個問題就是我需不需要數學?這我剛才已經回答過,就不再重複了。

第二個就是數據(data)。你的data哪來呢?當然我們有很多現成的數據,比如象我們做實證研究的,手頭都有一些數據,但是你們以後去做實證研究,不管是去公司里做還是在學術界做實證研究,往往你需要自己去收集數據,這個時候你的數據是第一手的,尤其是在初始起步階段的時候,你的樣本不可能太大,樣本大就需要錢,你沒那麼多錢,這樣你的樣本量不太大。那你要做這個研究,怎麼才能讓自己的研究成為一個好的研究呢?你就要去考慮。

首先,你要新,你要注意,是不是在你樣本不大的數據裡面有一些變數是別的大樣本的數據沒有的。或者你研究這個問題別人從來沒研究過,你是第一次通過收集數據的方式來研究。

第二,一定要是well-defined,就是你這個數據一定要非常清楚地定義。比如,根據已有的文獻,social capital是定義為這樣幾個方面,它們都是這樣去度量的,用什麼樣的問題來問的,所以我在我的問題裡面也這樣問,這樣你就可以得到好的度量(good measure)。最後,你的數據要well-structured,就是該有的變數你要有,你想identify的那些機制的中間變數你也都有,那麼即便你的樣本小一點,也可以做很好的研究。

第三,你要有非常聰明的idea,當然這很難了,所以要求就越來越高了。在計量裡面,通常來講你看到的變數和變數之間的關係只能說它是一個相關性(correlation),但現在的實證研究已經越來越不滿足於相關性,而是要去看causality。看因果關係一個常用到的方法就找工具變數。那麼,這時候你用什麼樣的方法去看causality?用natural experiment?用足夠讓大家確信的外生變數?還是去找工具變數?這就需要你有非常聰明的想法來讓大家確信你看到的確實是一個causality,而不是一個因果不明的相互關係。當然這個要求比較高了,在很多研究領域裡面都是前沿課題。對於我們來講,有的時候不要隨便說你找到causality了,就是發現相關就很不容易了。

最後是計量分析(econometric analysis),就是要去分析、回歸、解釋結果等等。我們得到結果以後就可能碰到這樣的問題,首先我們會發現,這個結果好像不對,我們感覺到的現實好像不是這樣的,具體表現為符號或者顯著性不是事先預期那樣的。這個時候就要注意,有可能問題出現在如下幾個方面,你一定要去想是哪些方面出了問題,然後再去調整它,而不要去做datamining的工作。第一個,數據可能是不好的。數據不好的第一個原因可能是因為用了中國的數據。中國的很多宏觀統計指標是很粗糙的,比如中國的失業率本身就不是真實的失業率,你用了就有問題了。還有可能你的樣本不是一個隨機的樣本,還有就是你的樣本量太小了,這些問題都有可能導致你的數據質量不高,從而你想看到的東西看不到。第二個可能性就是理論出了問題。這又有兩種可能性,一種是之前基於的理論是錯的,或者它根本不反映現實情況。還有一種可能性是,可能存在一個新的理論或機制,它抵消了你原來認為的那個機制。

比如在我們自己做的一個研究裡面就碰到過這樣的情況,我們在做經濟開放和國內市場分割這個相關性的研究的時候,本來覺得開放了使得競爭加劇,競爭加劇應該使得國內市場整合,結果後來發現往裡面一放是線性關係,而且是正的,就是開放是促進市場分割的,那我們就想為什麼?有可能是在經濟發展的早期階段,開放是促進市場分割的,在經濟發展到一定階段,開放就促進市場整合了,於是有可能存在二次的關係,我們把二次項往裡面一放,果真一個非常漂亮的U型曲線就出來了。當你在正確的理論指導的情況下去做計量的時候,你就會知道怎麼去加東西,是改變模型的形式還是改變數據,還是改變你的measurement?之後你在理論的指導下得到的結果就可以幫助你發現新的東西,因為在我剛才講的這個U型曲線的下,就告訴我們,在理論上經濟的開放和市場分割的程度取決於開放的程度,這個是在既有的理論里沒有的東西。事實上你們在座各位如果有人對此感興趣,你就完全可以去做這樣一個理論來描述經濟開放和市場分割之間的關係是一個象我們所看到的U型,這時候你就知道理論和實證是一個什麼關係了。理論是怎麼來的?不是憑腦袋想起來的,是把現在已經發現的事實和規律形式化(formalize)。

研究之後我們得到很多結果,這時候你還有一些工作要做。第一個就是你要去解釋它,我們很多同學做完了計量以後說,我的結論是x和y 正相關,x和z負相關。這毫無意義,就象你做了一個數學模型,做出來以後,它的經濟學含義是什麼?你要去解釋為什麼是正的?為什麼是負的?為什麼有非線性的關係?另外大家要區分兩個significance。一個是econometric significance,它指的是在統計上x和y之間的關係是不是顯著的。還有一個是economic significance,它指的是係數到底有多大,就是經濟上的顯著性,它能告訴你一個因素的重要程度到底有多高。然後你還要在這個基礎上得到policy implication,即政策含義。

如果你像剛才講的那樣去做了,我就要祝賀你了,因為你已經在一個正確的道路上向一個好的經濟學家前進了。

一些評論

接下來我再做幾個結論性的評論。第一,儘管我前面講了計量如此之重要,現在我要跟大家講的第一個評論是,large sample plus econometrics is not everything。就是說,你不要以為,做計量、做實證,唯一的路子就是去做大樣本加上回歸。首先,計量經濟學所做的很多工作,往往還不足以identify兩個變數之間的作用機制,在這個層次上,計量和理論是互補的。理論能夠幫你解釋,為什麼x和y是正相關的?機制是什麼?而實證幫你看到的只是x和y正相關,如此而已。

除了理論能夠幫助我們思考這些機制性的東西以外,案例case有時候也是非常重要的。我們經濟學家現在已經非常看不起case,但是我覺得case很重要,因為有的時候,機制在計量裡面是不清楚的,這個時候就需要去做一些case study,去觀察一些現實來告訴你,你為什麼在計量上有可能看到x和y是相關的。

第二種情況是,有的時候很多東西是不能度量的。計量經濟學一個依賴的前提就是每一個東西都可以度量,但是不是每個東西都可以度量呢?比如什麼叫制度?什麼叫法律?什麼叫產權?什麼叫民主?其實,有的時候,一些可度量的東西往往沒有不一定能準確地捕捉到現實生活中的機制。

第三,有的時候數據幾乎是不可得的,但是問題非常重要。比如上個學期的時候,我在經濟學院作過一個報告,討論中國的私有化和腐敗。通過案例的方式來告訴大家,在中國,私有化導致了腐敗的原因是因為我們以前就設置了一個非常錯誤的制度結構。這個問題非常重要,但如果你想用計量經濟學家來告訴大家私有化造成了腐敗,你要有large scale sample。比如你要有500家企業,而且你要找到腐敗的度量,你能通過問卷得到腐敗的大小嗎?所以這種情況下案例就非常重要了。講到這裡,我就特別要強調,計量有計量的好處,它是大樣本的,比較可信。這時候你在那些可以度量的、可以收集數據的問題上,就盡量要用計量的方法。案例用在數據幾乎不可得、問題和作用機制又非常重要的問題上,你千萬不要去做那些大家都覺得可以用計量來做的,你說你用案例來做,就沒有人信你了,因為案例可能就只有幾個觀察點。

2004年的時候我發表過一篇文章《把實證研究進行到底》,有幾句話我想給大家看一下。第一,計量是有陷阱的。我剛才講過,不同的人有不同的道德底限,每個人報告什麼取決於他自己。由於現在學術的規範,這是非常難做到的。在國外,你如果發表一篇實證的文章,你的數據就需要公開,要使得你的審稿人可以重複,這個時候你就不敢隨便報告結果了。第二,你會發現在實證研究的發展過程中,經常是有一篇實證文章說前面的結果不可信,我得到的是可信的,而結果是相反的。那大家就很慌,為什麼呢?因為做理論,你只要證明x和y是正相關,它確實在紙上是對的。但做實證,已經發現x和y是正相關,但你卻明明發現它們是不相關的,那你就很慌,就生怕過了三年自己的文章沒人引用了。可是我覺得這裡面就需要解決一個問題,就是計量到底是什麼?經濟學的理論工具特別是計量工具就像我們在研究天文現象時候的望遠鏡,望遠鏡可看的遠的程度相當於計量方法的科學性的程度。計量的方法是在不斷地往前推進,隨著方法的推進,以前得到的結果很可能就是不可信的了。這就好比你用望遠鏡去看這個世界,到現在為止你沒看到上帝,你就以為上帝不存在了?不一定的。只是現在的望遠鏡看不到。從這個意義上講,科學最後實際上是無窮逼近於神學的。所以我們千萬不用怕,覺得我們用的方法不夠先進,沒有看到正確的東西。從這個意義上講,我想說,用發展的眼光來看,所有的研究都是錯的。因為如果沒有當初的地心說,我們到現在還以為世界就是在一個大烏龜的背上。恰恰是因為有了地心說,後來才慢慢有了日心說。

再接下來看一張漫畫[1]。它講的是非典型性肺炎的意思,很多盲人去摸這個象,有人說是恐怖襲擊,有人說是病毒,有人說是細菌,就好像不同的計量有可能得到不同的結果。我們到底應該信誰呢?Feldstein講過一句話,他說,「這個故事的重要意義不在於每個盲人帶著片面的、「不正確的」印象而去,而在於聰明的王公(經濟學家)研究了這五個盲人的發現後,能把各部分拼在一起,形成對大象的正確判斷,特別是如果他以前曾看到過其他四腿動物的話。」

這是什麼意思呢?就是說,計量經濟學研究和我們對於世界的準確認識之間的關係是這樣的:並不是說你要去相信某一篇文章,你如果想形成對這個世界的整體看法,你是把很多實證文章放在一起,每一篇文章可能都是盲人摸象,但對於你自己來講,對於一個好的經濟學家來講,應該把這些文章放在一起,形成對這個世界相對來講比較完整的看法。比如我剛才講的不平等和增長的關係,大多數人的研究都認為它們是負相關的,這個時候你就應該相信兩者的關係確實是負的。所以,這就是為什麼同樣一個問題,不同的人反覆做的原因。有的改進方法,有的改進數據,因為在不斷做的過程當中,不斷重複的過程當中,我們就對變數間的關係有了更為清晰的認識。

講到這裡就差不多該結束了,讓我們的經濟學研究走向現實,讓我們將實證研究進行到底。


點擊我的頭像

朋友圈分享:點擊右上角圖標,分享到朋友圈。加關註:點擊標題下 會計與資本市場研究平台 即可關注

【查看歷史消息】即可查看往期推送。

長按下方二維碼,「識別圖中二維碼」即可輕鬆關注

推薦閱讀:

抗癌|治療:素食真的能降低患癌率嗎? 牛津大學研究如此說
八字命理如何研究
徐偉剛八字研究2
訪談 | 李向平:「神聖」研究三十年
郭耀華研究二戰後新泛伊斯蘭主義的發展與挑戰(一)

TAG:實證 | 研究 |