【轉】如何寫實證經濟學論文
資料來源:人大經濟論壇
(一)
一、整體寫作
之所以叫「整體」是因為寫經濟學論文必須有通盤考慮,否則寫出來的東西即使技術含量很高也難以發表。本文主要討論發表型論文(非學位論文),並且僅以實證研究為例。本段的重點是寫作,故而所有技術工作全部列入前奏部分。
0.前奏
實證的文章首先要有數據,沒有數據一切都是扯淡。所以,先把數據處理好。處理數據分兩個基本步驟,第一為數據清理;第二為數據計算。這裡沒有統一的標準應當如何處理數據,但有一個基本要求就是做好Identification。技巧是,要麼你借用比較成熟的理論模型,由理論模型到計量模型。這樣ID不會有太大的偏差。如果是自己構建計量模型,那麼ID的工作要自己嚴格按照統計和計量要求做,對模型的假設前提與限制有全面準確的理解。國內的實證文章,包括刊發在《經濟學(季刊)》、《經濟研究》等「頂級」期刊的,普遍存在ID不清的問題。
1. 研究問題
假設所有模型構建、數據分析、穩健性檢驗都完成了,這個時候你要動筆寫論文。在這個階段,你要做的第一件事情是搞清楚自己在研究什麼問題!!!
其實,確認研究問題應該在處理數據之前,否則你很難想像連問題都不知道,你如何處理龐大的原始數據。我之所以把數據處理放在確定問題之前,主要是基於現實的情況。如果我們確認了問題,但數據處理的結果不支持我們的預設問題,那麼結果可能前功盡棄。所以,很多實證文章都是先做試驗後確定論題的。
但是,一旦有了結果,你就必須嚴格界定自己的研究問題。第一,你要用簡潔但準確的經濟學規範用語表達自己的問題。第二,注意表述中問題的導向性,確保讀者看到問題不會疑惑。第三,確認這個問題是新問題!!!
2. 方法論
當你有了實證結果又確認了自己的研究問題是不是就萬事俱備了呢?不,至少,在這個階段,你還不能動筆寫論文。
你必須要明白,論文的成功不僅僅依靠「完美」的實證結果!!!任何實證結果都是大廚做出的菜,一位廚藝高超的師傅可以用普通原料烹制出美味佳肴。所以,「完美」的結果有時候只能蒙外行,卻不能欺騙審稿人。這裡,我強調邏輯推理與闡述問題時的語言流暢性。不要小看這兩個問題,用什麼樣的敘事結構去組織文章很大程度上決定了文章的檔次。
每個人有不同的方法論,但在這裡應該大致上趨同。被普遍接受的方法無外乎是「提出問題,解釋問題,闡述問題的重要性,提出解決問題的方法,突出你的貢獻」。在論文主體部分,應當注意,問題的提出和解決必須嚴格按照邏輯順序,要有寫「小說」的心態,做好鋪墊,突出重點,善於總結。時時刻刻注意論文的走向,並且確保讀者(甚至是外行)可以通過你的引導輕鬆抓住文章的重點要點(即使他們未必理解所有經濟學術語和計量方法)。
3. 提綱與計劃
在解決了數據、論題、方法論之後,你可以開始制定計劃。這種計劃不是國內寫的那種空而無物的標題式提綱,必須在每一個段落明確寫作目的,明確所用模型(或其他方法)的假設與限制,明確寫作的要點。
完成計劃初稿後,不要動筆。
兩天之後修改計劃。
再兩天之後交給其他人修改。
一周之後自己再修改,與導師(或者其他有經驗的同行)商議定稿。
4.寫作與發表
接下來,按照提綱擴充論文,具體步驟將在下一段中詳細展開。論文完成之後,不要立刻修改。等兩周,等自己把一些固有想法淡忘之後再復讀論文進行第一次修稿。將第二稿給同事修改,返回後再次修改。這個過程中可以舉行seminar或者workshop,一定要得到反饋意見。梳理和總結意見,進行第三(N)稿的寫作。
嚴格地說,在大修改之後,應該再次做presentation以確認修改是成功有效的。
隔一段日子,對論文重新進行修改,定稿。一般論文從初稿寫作完成到投遞刊物應該有3-6個月。投遞之後,如果通過初審那麼一般會要求作者再次修改(一次就刊發的稿子很少很少),那麼接下來就是漫長的修改與等待了。
二、細節與步驟
一般實證論文分為:「摘要、引言、理論框架、實證部分、總結」五大部分,其中實證部分可以分為「數據描述、實證模型、實證結果、穩健性檢驗」。
最後寫作摘要和引言,這是慣例。一般應該先寫作理論框架,隨後可以確定ID的方法,然後解釋模型的設定和數據情況,最後報告結果與穩健性結論。
這些問題一般國內談得比較多,也不需要太多的贅述。我想著重談談引言部分。
引言部分應該包括(按順序):問題的提出、文獻綜述、方法選擇、結果報告、文章結構安排
1、要提出問題,並且解釋問題的重要性。
2、告訴讀者現存文獻研究到了什麼程度,有什麼局限,你的研究有何種貢獻。
3、介紹方法,闡述清楚自己的研究思路。
4、簡單明了地把結果或者結論告訴讀者,如果他們有興趣會認真去看論文的主體部分,否則。。。
5、例行公事,要把後文的結構安排預告
不要在論文中單獨出現文獻綜述部分,除非是學位論文寫作,不然沒有必要。第一,沒有人去看文獻回顧,對於外行來說這就是天書,對內行而言這些都是廢話。文獻回顧的價值是突出自己研究的貢獻,告訴讀者你做了哪些前人沒有做的工作。
如果我們仔細去看國內所謂頂級期刊的論文引言,有一些真的寫得非常爛,根本不符合基本的寫作規範,也達不到引言的作用。首先,讀者不關心過於「宏觀」的事情(比如,彩旗迎風、鑼鼓齊鳴,xxxx發表講話),這種政治性高調在論文中沒有意義。其次,讀者不關心學派之爭,不要去批評某些和你不屬於一個流派的作者。最後,讀者關心論文的方法和結果,但很多作者在引言里隻字不提。
三、尾聲
實證性文章的結果是報告參數,但其實這些參數的具體值並不重要。這話也許很矛盾,既然我們的工作是圍繞著參數進行的,為什麼具體值又不要緊呢?
第一,這些參數解決不了實際問題。它們不是圓周率的pai值,也不是物理中的g值。就算你計算出了一個很重要的參數,又能如何呢?
第二,參數的解讀可以幫助我們理解經濟學問題或者現象。從這個角度說,解讀比數字本身重要。
第三,由於國別(或者地區)差異,很多參數並不具備普遍性,也很難真正解釋世界。不能誇大參數的作用,這一點國內研究做得非常不好。為了達到某種效果,無限誇大參數估計的力量,使得很多人迷失了方向。
小小的總結:
從結構看,摘要和引言最要緊。因為審稿人不看內容,單憑這兩部分就可以拒搞。
從內容看,數據描述和模型設定最重要。因為這部分往往是錯誤最集中的地方。
(二)
在本文中,我只是試圖給實證文章分分類,但絕對不是什麼標準分類。 本文的目的還是希望引起討論,並把一些好的範例介紹給大家。歡迎跟帖,我會整理並添加新的意見。所引論文全部為外文資料,這樣也省得涉及對國內作者和期刊的褒貶不一。(這不表明國內論文沒有好的範例,請勿聯想。)
在切入正題前,我想提一下經常做理論文章的Lucas(Robert Lucas)。也許本文的讀者大部分對實證感興趣,或者自己就是做實證研究的,但我還是想強調下理論論文對實證的重要性。大家知道很多人選擇實證領域是因為自身數學、計量統計等專業能力所限,不得不轉做實證,而真正理論過硬、數學過關的經濟學家一般偏向做理論。你可以不同意這個觀點,但這個潛規則客觀存在於這個圈子。發生在我自己身上的故事,我的老師們(包括我提到過一年發一篇JME的那位)都希望我選擇理論方向,但我自知水平有限選擇了實證研究。他們同我說:「假如你認為做實證可以不學理論,或者說逃避過理論關,那麼你的論文永遠是中學生水平。事實上,實證論文比理論難得多!」
這段話,我最近才慢慢明白過來。類似的話,做純計量理論的老師也同我和我的同學說過,當然,一開始我們都不信。隨著自己的成長,我逐漸發現他們的話是對的,所以,我把故事寫出來。希望真正想做出優秀實證論文的同仁們一起探討。
回到Lucas的文章。之所以說他是因為我的老師曾經提起過,現役的經濟學家中有兩位的文章寫得好。這個」好「與經濟學無關,只和英文寫作有關係。其中第一個是Lucas,第二個是Acemoglu。可能,他的總結主要局限於宏觀領域,不過我們不妨學習下這兩位的文章。
Lucas論文:
http://home.uchicago.edu/~sogrodow/homepage/papers.html
Acemoglu論文
http://econ-www.mit.edu/faculty/acemoglu/publication 他們都可以稱為著作等身了,所以上面的鏈接無法窮盡他們的所有作品,有對宏觀理論有興趣的讀者可以慢慢去查。 重點推薦兩篇:
Lucas,2004的一篇JPE,論述收入和鄉城移民的理論文章,http://www.pinggu.org/bbs/thread-886664-1-1.html
Acemoglu et al.,2001的一篇AER,用殖民地做IV研究制度與經濟發展關係的實證論文 http://econ-www.mit.edu/files/4123
這完全是兩種風格和類型的文章,但是它們有一個共同的特點——一針見血。無論是闡述理論模型還是討論現實問題都言簡意賅,不搞迷魂陣。Lucas的文章雖然是理論論文,但讀起來不枯燥,他會盡量使用短句和淺顯的詞表達最直接的意思。這也是為什麼我的老師很推崇Lucas,一個能複雜問題簡單化的人是真正的大師。反之,大家懂的,倒過來操作的人在我們生活中比比皆是。Acemoglu也是理論大師,他的實證文章相對比例較低,上面推薦的一篇我個人認為是經典之作。對於研究制度與經濟發展之間的關係,理論模型有,可如果沒有實證研究來驗證理論預計是不夠的。而Acemoglu使用殖民地的情況做IV很好地解決(或者說盡最大可能解決)了內生性問題,這也是大部分實證研究所面臨的難題。
小結:
理論文章要帶著對現實的關注,比如Lucas(2004)。實證論文要回答理論問題,或者提出新的理論難題,比如Acemoglu et, al(2001)。
=============================================================
下面,正式地,我們討論實證論文本身。
目前好的實證論文已經不能缺少Theoretical Framework(理論框架)部分了。當然了,那種為了拼湊一個理論框架而無病呻吟的做法不可取。
我想用一篇尚未發表的論文來做例子:
http://www.economie.uqam.ca/pages/docs/Manovskii_Iourii.pdf
Price of Experience
此文,通過一個簡單的計量模型做引子,提出問題」為什麼我們在數據發現人們的收入與工作經常成負相關?「。這是典型的實證做法,數據來自美國、丹麥和瑞典。有了這個疑問,讀者被吸引住。
我當時看文章的時候有種讀小說的感覺,很想知道後面寫了什麼。
然後是理論部分,這個部分並不難,如果讀者有興趣可以下載論文一看。他們其實就引入了經驗指標,並通過簡單的數學變形構造出可以用於計量模型的理論模型。這個套路也不是特別難的事情,但要做得嚴謹和巧妙還是需要花費一些腦筋。
隨後的部分是計量模型,但讀者理解了理論部分,計量就成為順理成章的事情。但作者很小心地寫了一節」識別「(Identification),這是國內實證論文最大的軟肋,沒有之一。因為我們不太注意識別問題,所以很多看似高深的計量論文其實就是糊弄人——有時候作者糊弄讀者,更多的時候作者自己也被糊弄。簡而言之,就是論文研究的主要問題在計量模型中沒有體現,而計量模型中測量的是其他問題。也就是我們的經常講的,驢唇不對馬嘴。關於這個問題請參見:http://www.pinggu.org/bbs/thread-893428-1-1.html
隨後,作者彙報計量結果,本文主要測量兩個參數值(他們的做法有點像宏觀的路子,儘管用的是微觀數據),這裡不展開。然後,使用幾種替代性的Specification。最後總結。
縱觀全文,構思巧妙,提出的問題很吸引人,理論模型直截了當與計量模型高度貼合,計量識別討論充分,考慮諸多因素,並指出不同的specification。儘管這還是沒有發表的working paper,但其水平已經很高。相信很快我們就可以在世界上30-40名的經濟學期刊上看到,甚至可能進入前20名。
如果我們對照下自己的文章,不難發現差距是全面的。第一,問題提出的方式不如他們新穎。第二,理論模型構建不夠巧妙。第三,實證部分識別難以自圓其說。
======================================================================== 接下來,我用JDE上剛剛錄取的一篇論文(Urban growth and uninsured rural risk: Booming towns in bust times)做例子: http://www.pinggu.org/bbs/thread-885521-1-1.html
這是標準的發展經濟學實證文章,使用是國別宏觀數據,與上一篇微觀數據略有不同。
基本調子很簡明,要討論城市化與經濟增長的關係。如勞動經濟學版塊老大deltaatfr所言「嗯,好文章就是這樣,簡介幾句話,把問題就說清楚了。這篇文章立意很好,提出城市化與經濟增長也可以是雙軌機制,這就跳出傳統傳導機制的束縛了。」
具體的模型推導等,這裡從略,我想突出一點,關於本文最後部分的模型檢驗。實證論文最怕無法檢驗自身模型的正確性和適用性,而本文採用模擬值與數據值比較的辦法(out of sample prediction),就是在所有國家中逐一去除一組國家(如亞太國家,撒哈拉國家、拉美國家等),然後用估計係數代入重新模擬出這組國家的城化率趨勢圖。這種檢驗直觀而且有力,我們看圖就知道模型的效果如何。當然,在宏觀中有calibration一環,與此還有一些區別,這是題外話。
圖中第一行是沒有IV的結果,第二行是使用IV的結果,對比明顯。
最後,算是一個小小的總結,回答到底實證文章分哪些類。
我只能說常見的:
第一,純實證,沒有理論部分。好的純實證文章有兩種用途,第一,檢驗某種理論是否符合現實;第二,為了提出新理論問題尋找現實數據支持。一個比較現成的例子是國際貿易中的引力模型。基於引力模型的實證文章很多,一般不需要再贅述引力模型的原始推導過程,可以直接做計量模型。
第二,實證加理論。這樣的論文是從數據而來,發現問題,然後用理論解決問題。也就是說,現在計量在前,然後開始構建理論。這類文章其實並不多,因為太難了。
第三,理論加實證。現在大部分外文期刊的實證論文多是這個模式,有一個歷史文獻中有的框架(當然有所改變,看要解決什麼問題),然後從理論到計量模型。
如果還要細分,第三類可以再拆開:
1、引用經典理論模型,稍加修改,符合特定實證問題的要求。
2、基於基本經濟學理論,構建自己的理論模型,然後過渡到計量模型。
(三)
為了節約大家時間,我寫得簡短點。四個問題:如何讀文獻、如何找數據、如何選題、如何看待中國問題
一、如何讀文獻
先找Handbook,後找文獻綜述,通過這些框架性的文獻了解本領域的發展。對於最新的文獻要緊盯working paper,比如NBER和IZA等。有必要的話應該訂閱IDEAS的郵件提醒,他們會定期把指定選題的最新working paper鏈接發送到你郵箱。
對於實證類的文獻,核心內容兩個:方法和數據。方法上的演進有明顯的階段性,即在某一個時期內某一種或幾種方法會特別流行。讀文獻的時候要知道這是為什麼,並且了解那些方法的優劣。數據的積累完全是依靠讀文獻得來的,平時多搜索數據很必要,但這與文獻的閱讀量也分不開。
在瀏覽過一個領域200-300篇文獻之後,你就應該可以了解歷史情況和前沿動向,進而理解自己所處的時代和位置。要想做前人沒有做過的事情,一個靠技術進步,一個靠新數據。如果兩者都沒有,就要靠選題,這個問題我們留在後面講。
二、如何找數據
其實我前面已經講了,數據的熟悉依靠文獻積累。除了知道數據的來源,還要熟悉數據,知道質量的優劣,了解主要變數的內容。對於那些無法從公開渠道獲得的數據,要想辦法通過擴大社交面和學術影響。比如你看到一個文獻使用了不公開的數據,你就該大膽的聯繫作者。雖然絕大部分時候,他們都不會同意共享數據,但你要跟這些人保持聯繫。壟斷數據的人,大致兩類人。
第一類是老資歷的,他們的數據有著明顯的局部利益,所以你很難接觸到。但除了核心層之外,還有外圍層,他們通過合作的方式獲得了數據,只不過因為保密協定不能公開。你如果與外圍搭上了線,那麼通過二次合作你起碼有接觸數據的機會。
第二類是年輕學者通過個人努力或者小團隊手工收集的方法編製的資料庫(或者基層調研數據),他們不公開的原因是「太珍貴,不捨得」。這類情況,你就更應該給他們發信,告訴他們你可以使這個資料庫的成果更豐富。當然,這也要別人能「看得上」你的科研能力。
所以數據問題,一個要肯找,一個要肯磨。筆者的經驗,你越與別人交流多接觸多、「磨」得厲害,成功獲得更多保密數據的可能性就越強。那些牢牢掌握數據優勢的人也不都是天生的,一部分就是靠「軟磨硬泡」進入圈子的。但有一個是硬功,那就是你自己必須有過硬的科研能力及發表。否則,不要怪別人不帶你玩兒。
三、如何選題
在理解文獻,了解前沿,掌握數據的前提下,選題就不是太難的事。我總結了三點:
第一,新意。這種新意可以是方法層面的,也可以是數據層面,也可以兩者兼而有之。當然,最高端的新意是用通行方法,比如OLS,用公開數據,選一個新的切入點。這種新意往往需要很多年的經驗和沉澱,應該是我們努力的方向和追求的終極目標。對於在校學生,特別是本科生,不應該做這樣的強行要求。
第二,可操作性。可操作性主要是基於現存的數據和現有的技術條件,是否可以完成「新意」。有時候數據不給力,有時候方法不給力。如何解決操作性?筆者的經驗只有一條:合作。這個時代閉門造車顯然是下策。你有想法,有數據,沒有技術,可以找技術好的人合作。你自己技術好,沒有數據,可以找壟斷數據的人合作。通俗說,這就是一門「生意」,各取所需,達到共贏。如果抱殘守缺,就不要眼紅別人的成績。
第三,營銷。所謂的營銷就是向別人推介自己的成果,說白了就是如何讓讀者、編輯都接受你的觀點。這方面過去被忽視了。一篇好的論文,營銷應該在研究啟動的時候就被列入計劃。也就是說,除了要解決數據和技術問題,還要解決好文章投什麼會議投什麼期刊,要突出什麼方面,儘可能降低拒稿。舉個例子,如果使用了從未有過的資料庫,就應該在文獻回顧中點出以往文獻中的數據缺陷,對比之後,強化目前資料庫的優點。如果使用了新技術,也是這個邏輯去「營銷」。俗話說得好,「貨比貨得扔」,如果沒有辦法在營銷中突出自己的優點,那就不能怪審稿人「沒有眼光」。審稿人發現不了夜明珠,通常是因為夜明珠沒有發出耀眼的光芒。
四、如何看待中國問題
中文文獻把中國問題當作主要問題研究,這無可厚非。英文文獻把中國問題當作個案研究,也無可厚非。作為研究者,你要清楚讀者是誰,簡單講產品賣給消費者,你要懂消費者需求和心理。中英文期刊的導向有很大差異,不要把英文期刊的那套拿到中文期刊,反之亦然。分清了市場和消費者,你才明白應該把中國問題放在一個什麼位置上。
對於國內的科研來說,政策導向是繞不過的。筆者認為,提政策導向本身沒有錯,錯的是事事都要以這個為標尺。國內的政策變化頻繁,本身就是很好的「准自然實驗」機會,或者提供了政策評估的機會。而這些,從實證角度,既有現實意義又有學術價值。認清這一點,不僅可以提供很多研究選題的思路,更能夠提升研究的質量。
對於國外期刊而言,中國問題是個案,是對發達經濟體研究的補充。這個定位短期內無法改變。所以,在強調中國國情的同時,應該考慮到這樣的特殊國情到底在經濟學上意味著什麼。國內的數據和政策所帶來的研究成果如何幫助我們理解其他發展中國家,甚至如何經濟發展的一般規律。這一方面,我們的研究者往往忽略,或者「力有不逮」。
總結
決定一個研究成敗的因素很多,筆者分析過,失敗的原因有時候非常不起眼。一般而言,一個受過良好訓練的博士,犯低級錯誤的幾率並不大。之所以論文質量總是無法有提升,很重要的原因是細節沒處理好。這些細節從文獻回顧、數據選擇、結果討論,到標題的吸引力、摘要的簡明扼要、結論的實事求是、營銷的恰當好處,不勝枚舉。很多人寫實證論文,把所有精力投入計量,這是很大的誤區。誠然,計量不過關是很容易導致失敗。但有了好的數據和方法,也不一定能獲得成功。
本文所講的經驗是基於筆者投稿和審稿的大量實踐。這種積累大多來自審稿人的批評和幫助、來自與合作者及同行的討論,也來自於自己做審稿人時與編輯部的溝通。失敗了,要明白到底錯在哪裡,今後才能提高。被拒了稿子,稀里糊塗是不會有長進的。同樣,成功了要知道自己對在哪裡,別蒙對了一回,下次又栽了跟頭。
祝走在學術道路的朋友,都能有雲開霧散的一天。
推薦閱讀:
※【推薦書單】想要入門經濟學,這些書不得不看
※我眼中的經濟學
※021 纏中說禪買點定律與短差程序
※[原創]房子是怎麼樣保值的?
※《頭號玩家》中的互聯網思維與壟斷
TAG:經濟學 |