論文經︱計量經濟學實證論文寫作全解析

文章作者:陳強  山東大學經濟學院

 A good empirical study requires three components: 

   1. A concise and sensible theoretical framework that is related to the questions to be asked, 

   2. Reasonably good data, and 

   3. An experiment or an event or a set of circumstances that give the data a chance to answer the questions asked. In short, the model needs to be identifiable from the data at hand.  -- Zvi Griliches

1、什麼是論文

究竟什麼是論文?簡單地說,論文就是對新的研究成果的彙報。為什麼一位成績優秀的學生,在撰寫畢業論文時可能一籌莫展?這主要是因為,平時上課做題,主要學習已有知識,只需被動消化吸收即可,有固定模式可循;而做研究寫論文,則需主動創造 (哪怕是一點點) 新知識。因此,剛起步研究的學生,面臨著從學習知識 (學生) 到創造知識 (研究者) 的轉型。

論文與一般的文章或散文不同,後者可以僅僅表達某種情感,或記錄一些事情。經濟學論文必須用十分嚴謹的數理邏輯或統計推斷,來一步一步地得到結論,保證每個環節都絲絲入扣、經得起推敲;而不能隨便發表議論,或輕率地下結論。而且,論文貴在創新,其價值主要在於其原創性 (originality ) 或新穎性(novelty),即對於已有文獻的邊際貢獻 (marginal contribution),參見下圖。當然,本科或碩士論文並不要求有太多創新,但至少應有一點點創新;而絕不能是 「山寨版」 或抄襲。

已有知識與新研究的關係

一般來說,規範的實證研究包括以下幾個步驟,即準備階段、選題、探索性研究、收集數據、建立計量模型、選擇計量方法、解釋回歸結果、論文寫作、與同行交流、提交論文或投稿,下面分別進行介紹。

2、準備階段

如果以為今天想做研究,明天就可開始,或許不現實。要開始真正的研究,需要一系列的準備工作。首先,必須掌握一定的經濟理論,以獲得觀察經濟現象的必要視角 (perspective)、參照系 (reference 或 benchmark) 與分析工具 (analytical tools)。否則,即使看到經濟現象,也可能無從下手分析。正如錢穎一 (2002, p.2) 所指出:

我在哈佛大學做博士生的時候,韋茨曼 (Martin Weitzman) 教授問我,受過現代經濟學系統訓練的經濟學家和沒有經過這種訓練的經濟學家究竟有什麼區別?他研究比較經濟制度,經常去蘇聯訪問,問這個問題是從與蘇聯經濟學家交往中有感而發的。韋茨曼的回答是,受過現代經濟學系統訓練的經濟學家的頭腦中總有幾個參照系,這樣,分析經濟問題時就有一致性,不會零敲碎打,就事論事。

這正是經濟學界常說的 「像經濟學家那樣思考」 (Think like an economist)。當然,愛因斯坦更早就說過類似的話,甚至更為深刻:

你能不能觀察到眼前的現象取決於你運用什麼樣的理論,理論決定著你到底能觀察到什麼。

顯然,那種認為可以不需要任何理論指導而直接去 「看真實世界」 的想法或許過於天真了。這些經濟理論的學習,主要體現在微觀經濟學、宏觀經濟學以及經濟學的各專業課程上,比如金融學、財政學、發展經濟學、產業經濟學、勞動經濟學等。

其次,為了進行實證研究,還必須掌握一定的計量方法與統計軟體 (比如 Stata)。即使你收集到相關的數據,但數據也不會 「自己說話」,仍需要使用統計軟體,運用適當的計量方法進行統計推斷。因此,計量經濟學對於實證研究不可或缺。在具備一定的理論功底與計量訓練後,即可正式開始做實證研究了。

3、選題

Everything has been thought before, but the problem is to think of it again.  -- Johann Wolfgang von Goethe 

實證研究的第一步就是選題,即選擇研究的題目。對於剛起步的研究者,常常不知如何選題。研究者通常知道自己想要研究的領域 (比如,經濟增長),但這還不是一個具體的 「研究問題」 (research question)。

對實證分析而言,研究問題通常是有關 「 X Y 有何作用」 之類的因果關係。如果想研究 「家庭聯產承包責任制對農業經濟增長的作用」,就更具體了,此處 X 指 「家庭聯產承包責任制」,而 Y 指 「農業經濟增長」 。當然,實證研究也可以只有 Y 而沒有 X,比如對於某個統計指標 Y 的測算;但純粹描述性的研究已比較少見。

研究問題可以來源於理論 (比如,檢驗資產定價模型 CAPM 是否成立),也可來自對經濟現象的觀察 (比如媒體報道、社會調研);可以研究某政策的效應 (比如新勞動法對失業率的影響),也可以對文獻中已有論文進行改進。

如果沒有任何研究想法,則建議先瀏覽一些經濟學的頂級期刊。比如,經濟學中文期刊的 「四大金剛」,即《經濟研究》、《經濟學(季刊)》、《世界經濟》、《管理世界》;以及經濟學英文期刊的 「Top 5」,即 American Economic ReviewEconometricaJournal of Political EconomyQuarterly Journal of EconomicsReview of Economic Studies。這些頂級期刊都是經濟學的一般性期刊 (general interest journal),涵蓋經濟學的各個領域。如果確定研究經濟學的某個領域,比如金融學,還可關注《金融研究》等專業期刊 (field journal)。

瀏覽這些期刊中的論文 (通常技術性較強,故未必從頭讀到尾),可大致知道當前的經濟學者都在研究哪些前沿問題,取得了哪些成果,還有哪些未解之謎;進一步,可以評估他 (她) 們的研究方法是否可靠,以及可能的改善空間。

如果能提出好的研究問題,也許你的研究就成功了一半。什麼是好的研究問題呢?總的來說,研究問題越具體、越有趣、越新穎、越有可行性,則越好!

(1) 具體:簡單來說,在以上「 X Y 有何作用」 的句型中,應能明確 XY 具體是什麼。

(2) 有趣:你的研究問題為什麼重要?別人會感興趣嗎?為什麼我們要在乎你的問題 (Why should we care)?知道問題的答案後,能影響人們對世界某方面的看法嗎? 

(3) 新穎:論文的核心價值在於其創新性,即做出了文獻中所沒有的邊際貢獻。這種邊際貢獻可以是研究了新的現象、使用了新的 (更好的) 計量方法,或者使用了新的數據集。做研究的過程是創造新知識的過程,在本質上不同於學習已有 (舊) 知識的過程。

(4) 可行:即使你的研究問題很具體、很有趣、很新穎,如果找不到相應的數據,則不可行。

對於剛開始選題的學生而言,似乎自己能想到的題目,都已被別人做過了。其實未必。要想做出新的邊際貢獻,當然可在前人的基礎上,繼續拓展與改進 (改進計量方法,增加變數,使用新數據等) 。

另一方面,也可以完全撇開前人,去研究全新的現象。比如,20世紀70年代末中國農村實行了家庭聯產承包責任制改革,這是史無前例的。到了1990年左右,就湧現出一批研究農村改革對中國農業產出影響的論文 (比如,Lin, 1992)。又比如,2014年11月開始實行上交所與港交所之間的 「滬港通」。假以時日 (有了足夠的數據後),就可以研究滬港通對中國證券市場的影響。

即使是前人已經研究過的現象 (太陽底下沒有新的事物),也可用新眼光、新視角去觀察。重要的是,要有敏銳的觀察力,並 「像經濟學家那樣去思考」 (Think like an economist)。當然,對於剛起步的新手,應盡量避免已經被研究得很爛、或過於富有挑戰性的題目。顯然,備選的研究問題越多越好,因為能 「存活」 下來的研究想法通常不多。

4、探索性研究

If I have seen further it is by standing on the shoulders of giants.  -- Isaac Newton

盡信書,則不如無書。  --《孟子 · 盡心章句下》

有了潛在的研究問題後,首先需要進行初步的 「探索性研究」 (exploratory study),看看它是否具有新穎性與可行性。比如,通過查找文獻,考察別人是否已經做過類似研究,並大致了解數據是否可得。

(1) 通過文獻回顧評估選題的新穎性

論文貴在有新意。假設你找到了一個具體、有趣而可行的研究問題,但它究竟有多少新穎性,這就不可避免地需要查閱文獻,看看文獻中是否已有類似研究。如果別人已做過很相似的研究,則通常須更換題目;除非另闢蹊徑,找到很不相同的方法或數據。

對於中文論文,可在 CNKI (China National Knowledge Infrastructure) 中搜索。對於英文論文,可在 JSTOR (Journal Storage) 或 EconLit with Full Text (美國經濟學會) 輸入關鍵字進行搜索;二者均全文收錄了許多經濟類英文期刊,但前者有幾年滯後。對於二者未覆蓋的經濟類期刊,可通過一些主要出版社 (集團) 搜索,比如 Elsevier Science Direct, Springer Link, Taylor & Francis, Wiley 等。某些工作論文則可通過百度或谷歌搜索。

以山東大學圖書館為例,其電子資源的第一頁提供了如下資源 (參見下圖):

 

山東大學圖書館電子資源首頁

什麼時候開始看文獻,即看文獻的時機,也很重要。如果從一開始就大量地閱讀文獻,則可能被文獻所淹沒,望洋興嘆,自覺渺小。更好的方法是,當自己有了一定的想法之後,再去系統地看文獻。這樣,才會知道自己究竟要看什麼,也更能帶著批判的眼光去看。

另外,閱讀文獻的態度也十分重要。虛心地從經典論文中汲取營養,才能站在巨人的肩膀上,但仍應帶著某種批判性的眼光。事實上,由於經濟現象的複雜性 (經濟學還只是軟科學),任何論文都有一定缺點 (比如,忽略了某些可能重要的因素),也都有可以改進的空間 (甚至可能推翻作者的結論),故不必太迷信 「權威」。

既然經濟學還不是科學,獲得諾貝爾獎的經濟學家可能持有相反的觀點,那麼又哪來的權威呢?重要的是,使用邏輯與實證的方法對不同的觀點進行甄別與質疑。如果認為前人所做的研究已經十全十美,你都贊同,那麼,你怎麼可能做出新的邊際貢獻呢?

(2) 確定所需數據是否可得

在正式開始研究之前,還應大致知道所需要的數據不僅存在,而且可以得到。數據從何而來?一般來說,數據要麼是別人提供的 (比如統計局),要麼是自己收集的 (比如問卷調查)。尋找數據可以從網路搜索開始 (比如谷歌或百度),也可以詢問專家或同行。如果確實不知道該從哪裡找數據,還可關注文獻中同類研究的數據來源,然後溯本及源。因此,閱讀一定文獻之後,就應該基本了解該研究領域的常見數據來源了。近年來,一些國際期刊已在其網站公開了發表論文中所用的數據集與估計程序 。

5、收集與整理數據

從數據的來源格式來看,數據可分為電子版與非電子版兩大類。對於非電子版的數據,需耐心輸入數據 (通常先輸入Excel表,再導入Stata中),並注意檢查,防止出錯。即便下載電子版數據,也應檢查可能存在的錯誤。

實證研究的關鍵材料乃是數據。如果數據質量不高,則 「巧婦難為無米之炊」。無論多麼高深的計量方法,如果原始數據質量有問題,也只能是 「垃圾進去,垃圾出來」 (garbage in, garbage out)。Zvi Griliches 在 1994 年給美國經濟學會做的主席演講 (presidential address) 指出,由於經濟學家不夠注意數據的來源及產生過程,經常錯誤地解釋數據,導致研究的進展緩慢;如果不提高數據質量,計量理論方面的重大進展將無用武之地。為此,將數據導入統計軟體後,需仔細察看數據 (inspect the data)。一個常見誤區是,研究者只知進行回歸,卻不去熟悉原始數據 (raw data),或增加對數據的感覺 (get a feel for the data)。

察看數據的常見方法為,計算變數的主要統計特徵 (summary statistics),包括均值、最大值、最小值、標準差、相關係數等,並根據經濟常識判斷它們是否合理。比如,虛擬變數的最小值與最大值必然為 0 與 1;否則,此變數有誤。如果數據有時間維度 (比如時間序列或面板數據),還可畫時間趨勢圖。如果發現在某個時點上的變數取值異常波動,則應考察此數據是否有誤;即使數據無誤,也應考慮異常波動的原因。

總之,在察看數據的過程中,主要觀察數據中是否存在不一致 (inconsistent) 的地方;比如,出現了不可能、不現實或可疑的取值。如果發現,則要進行處理 (比如,可能是數據輸入錯誤),這被稱為 「數據清理」 (data cleaning)。

對於大多數從事應用研究的學者而言,主要是使用別人 (比如統計局、世界銀行) 提供的數據。即便如此,也應該對數據的質量有一個清醒的判斷,並使用相應的計量方法 (至少在做出實證研究的結論時,應考慮數據質量的影響)。在使用別人提供的數據時,還應注意其定義及統計口徑,是否是與理論模型中的變數相對應。比如,中國的失業率指的是 「城鎮登記失業率」,其統計口徑與標準教科書中以及西方國家的失業率概念有很大不同。

對於計量的初學者來說,與真實數據打交道也是加深對計量經濟學理解的重要途徑。只有弄髒你的手 (get your hands dirty),才能真正學會做實證研究。

6、建立計量模型

雖然實證研究可以沒有理論模型,但如果有好的理論模型作為基礎,則更有說服力。具體來說,回歸分析一般只能說明變數之間的相關性,要對變數之間的因果關係做出判斷,常常需要依賴於經濟理論。因此,即使無法提供完整的理論模型,也應該進行一定的理論分析。最理想的情形是,從理論模型中推導出計量模型 (econometric model),即待估計的回歸方程。一般來說,一篇好的實證論文,需要講一個好的 「故事」 (story),然後用數據來證實或檢驗此故事。

對於回歸函數的具體形式,可以考慮線性、對數 (變數只取正數且有指數增長趨勢)、雙對數、非線性 (邊際效應不是常數)等。在進行模型設定時,應盡量使用常識 (common sense) 與經濟理論 (economic theory) 。

比如,將 「人均變數」 (如人均消費) 與 「人均變數」 (如人均 GDP ) 相匹配;使用實際匯率來解釋實際進出口。又比如,考慮 FDI 對經濟增長的作用。由於 FDI 起作用需要時間,如果把當年的增長率對當年的 FDI 進行回歸,可能沒有太大意義。比較適當的做法是,考慮期初的 FDI 對隨後五年 (或若干年) 經濟增長的作用 (這樣做也可緩解雙向因果關係)。如果不確定該如何設定計量模型,可借鑒文獻中同類研究的模型設定。

另外,模型既不能過於簡單 (解釋變數過少),也不宜過於複雜,而應當保持適當的簡潔 (keep it sensibly simple)。在選擇解釋變數時,「從小到大」 (specific-to-general) 的建模方法簡單易行,但可能偏差較大 (因為存在遺漏變數);而 「從大到小」 (general-to-specific) 的建模方法偏差小,但不易執行。實踐中,常採用折衷方案,即選擇簡單而有解釋力的模型。

7、選擇計量方法

有了計量模型與數據之後,即可根據數據類型與特點,選擇合適的計量方法。比如,被解釋變數為虛擬變數,則可使用 Probit 或 Logit;如果是面板數據,則應考慮固定效應、隨機效應、時間效應等;如果是時間序列,則須先判斷是否含單位根,再決定使用相應的計量方法。

對於一般的數據,通常先做 OLS,看看結果,作為一個參照系。做完 OLS 後,可以畫殘差圖,大致看看擾動項是否符合經典假定,然後進行嚴格的檢驗。如果有所違背 (比如,存在異方差、自相關),則做相應的處理(使用穩健標準誤或 GLS)。

對於時間序列,還可檢驗是否存在結構變動 (鄒檢驗,Chow test)。另外,應該對數據的質量進行檢驗,判斷是否存在多重共線性、極端值、弱工具變數等,並做相應的調整。

由於受數據可得性 (data availability) 的限制,遺漏變數幾乎不可避免。因此,很有必要在實證論文中對此進行討論。不外乎以下兩種情況。第一,存在遺漏變數,但與解釋變數不相關 (需要說明為什麼不相關),故可以不做處理。第二,存在遺漏變數,且與解釋變數相關,則必須進行處理,例如增加控制變數、尋找代理變數、使用工具變數、使用面板數據等。

另一常見問題是內生解釋變數。此時,一般需找到有效的工具變數才能得到一致的估計。由於面板數據可以在一定程度上克服遺漏變數問題,故比橫截面數據或時間序列更有說服力。因此,如果可以獲得面板數據,則應儘力爭取。比如,對於中國的宏觀變數,如果使用全國的時間序列,則一般樣本容量較小。此時,可考慮收集省際面板 (provincial panel) 的相應數據。

大多數的實證論文都希望說明 XY 的因果作用。而從回歸分析的相關關係升華到因果關係,是很大的飛躍,需要使用適當的計量方法來識別這種因果關係。

總之,在這部分應該說明,為什麼所用的計量方法是最恰當的。計量經濟學的理論總是建立於一些理想化的假定基礎之上,而現實的經濟數據通常或多或少地不符合這些假定。因此,儘管計量理論是可以嚴格證明的一門科學,但實證研究在一定程度上卻是一門藝術,常需要在理論與現實之間找到適當的妥協 (be prepared to compromise)。

8、解釋回歸結果

There are two things you are better off not watching in the making: sausages and econometric estimates.  -- Edward Leamer

使用計量方法估計模型後,計算機軟體 ( 比如 Stata ) 將輸出相應的計量結果。此結果可能較長,包含密密麻麻的表格與數字。如果你嘗試了各種不同的計量方法與解釋變數 (alternative specifications),則結果就會更複雜。

如何看這些結果?簡單地說,只能用一個字一個字地看,直到看明白為止。當然,也有訣竅。計量結果可能很複雜,但真正重要的信息通常不多,比如回歸係數 (含符號)、 p 值,以及樣本容量、擬合優度等。以一元回歸為例 (工資對數對教育年限回歸) ,回歸結果參見下圖。

 

工資對數對教育年限的回歸結果

在上圖的回歸結果中,變數 s (教育年限) 的回歸係數符號為正 (與經濟理論相符),係數估計值為 0.0966245, p 值為 0.000 (在 1% 水平上具有統計顯著性),樣本容量為 758,而擬合優度 為 0.2527 (教育年限可解釋工資對數約四分之一的變動)。在上圖中,左上角的殘差平方和、右下角的置信區間,乃至常數項等信息,基本可以不關心 (除非有需要)。

在解釋回歸係數時,還應注意區分統計顯著性與經濟顯著性。「統計顯著性」 (statistical significance) 主要通過 p 值來考察。如果 p 值小於或等於 0.05,則意味著該係數在統計上顯著地不等於零;反之,則在統計上不顯著,在統計上可將此係數視為零 (不存在)。

「經濟顯著性」 (economic significance) 主要通過係數的絕對值來考察,須特別注意變數的取值單位。在上例中,解釋變數教育年限 s 的單位為年,而被解釋變數工資對數 lnw 可解釋為工資的百分比變化,故 s 的回歸係數為 0.0966245 意味著,每增加一年教育,未來工資收入將提高 9.66%,具有很高的經濟顯著性 (可能過高了)。反之,假如 s 的回歸係數為 0.01 或 0.001,則意味著每增加一年教育,未來工資收入只會上升 1% 或 0.1%,顯然在經濟意義上很不顯著。此時,統計上顯著而經濟上不顯著,則意味著解釋變數對被解釋變數的影響很小  (經濟上不顯著),儘管這種影響被估計得很精確 (統計上顯著)。

類似地,在進行計量檢驗時 (比如,豪斯曼檢驗),Stata 可能輸出很多結果,但最需要關注的只是原假設以及 p 值;因為知道二者就可以進行檢驗了,而其餘信息都是細節。

研究者通常花費較長時間收集與整理數據。將數據導入Stata,然後輸入相應的回歸命令,則是 「見證奇蹟的時候」 (moment of truth)。如果關鍵解釋變數兼具統計與經濟顯著性,符號也與理論預期一致,而其他控制變數的符號與顯著性也大體與預期相符,則會感到十分欣慰,過去收集整理數據的辛勞也都值了。

但有時,所得計量結果未必盡如人意,比如關鍵解釋變數不顯著,甚至符號與預期相反。此時應怎麼辦呢?大致來說,出現這種情況,可能有如下三種原因。

(1) 使用計量方法不當。比如,在上述一元回歸中,顯然遺漏了許多變數,可能存在遺漏變數偏差,導致 OLS 估計不一致。更一般地,如果存在內生性而未加以處理,將導致不一致的估計,使得本應顯著的變數變得不顯著。

(2) 數據質量有問題。如果數據存在較大的度量誤差,所用代理變數與真實變數相差較遠 (由於真實變數不可觀測),或者數據輸入中的人為錯誤,都有可能影響估計的一致性。

(3) 經濟理論有問題。在排除了以上兩種可能性之後,最後一種可能性是,經濟理論不正確。經濟理論所預期的某種效應可能不存在;或者同時存在其他作用機制,使得凈效應的符號相反。實證研究的目的之一就是檢驗經濟理論。如果發現已有理論與經驗證據不符,則說明此理論尚有改進空間,甚至需要放棄。正如林毅夫 (2001, p. 75) 所指出:

如果發現理論推論和我國經驗事實不一致,要堅持的不是現有的理論,而是進一步去了解我國的經驗現象, 然後, 根據經驗現象構建一個可以解釋這個現象的理論。所以, 當發現這種不一致時, 不要死抱理論, 成為現有理論的俘虜, 也不要在巨人的面前而感到自己渺小。其實,這正是對理論發展做出貢獻的絕好機會。

在計量實踐中,研究者經常根據計量結果而調整模型,以期得到更為理想的結果,並且只在論文中彙報最佳的結果,而將尋找此結果的過程隱去。這實際上是 「數據挖掘」 (data mining) 的一種形式。

數據挖掘既有成本 (缺點),也有收益(優點)。數據挖掘的優點是,可對數據進行各種 「實驗」,以期揭示數據中的某種規律性,發現模型設定的錯誤,以此改進理論或計量模型。數據挖掘的缺點則是,由於它根據數據特徵來設定計量模型,故模型設定由數據產生,如果再用此數據去檢驗由它產生的模型,就不是客觀的檢驗,由此導致偏差。

事實上,一定程度的數據挖掘是不可避免的,而這兩種形式的數據挖掘的界限並不清晰,正如 Heckman (2000) 指出,「儘管使用數據來檢驗受到該數據啟發的理論存在嚴重的問題,但如果拒絕從數據中學習並修改理論,則會導致更嚴重的問題」 。解決數據挖掘所帶來的偏差的方法之一是進行穩健性檢驗,而不是僅彙報最佳的結果。  

9、診斷性檢驗

任何計量方法都有其適用的前提條件;如果前提不成立,則無法使用此計量方法 (可能導致不一致的估計)。因此,在估計完模型後,應對計量方法的前提條件進行 「診斷性檢驗」 (diagnostic checking) 或作出定性說明。

比如,使用工具變數法進行2SLS估計後,應進行弱工具變數檢驗、過度識別檢驗 (假設存在過度識別)、解釋變數內生性檢驗;並從定性的角度說明 「排他性約束」 (exclusion restriction) 為什麼成立。

又比如,使用時間序列估計自回歸 (AR) 或向量自回歸模型 (VAR),則應檢驗殘差是否為白雜訊 (無自相關)。即使進行OLS回歸,也應說明解釋變數為什麼外生,或者遺漏變數偏差為什麼不重要。

10、穩健性檢驗

We have to learn...that the prime virtue of any econometric procedure is robustness. -- Robert Solow

為了使用特定的計量方法,研究者通常需要做一系列的假定。但問題是,論文的主要結果是否對這些假定很敏感?為此,有必要放鬆論文的某些假定,看結果是否穩健或基本不變,這稱為 「穩健性檢驗」 (robustness check) 或 「敏感度分析」 (sensitivity analysis)。比如,通過改變樣本區間 (或去掉極端值)、函數形式、計量方法、控制變數、變數定義、數據來源等,來考察計量結果的穩定性。

在計量實踐中,研究者通常會通過數據挖掘,找到 「最佳」 的計量模型。如果僅彙報此最佳模型,則會導致偏差。因此,有必要適當地改變模型的設定,比較其主要結果的變化。顯然,只有穩健的結果才有說服力,故穩健性檢驗已成為高質量實證論文不可或缺的一部分。

11、論文寫作

Learn to write but also write to learn. -- William Thomson

得到較為理想的實證結果之後,即可開始寫論文。簡單地說,論文就是對研究成果的彙報。為了便於讀者更快地從論文中獲取信息,經濟學論文通常有一定的結構,而論文寫作本身也是一門精益求精的藝術。經濟學家曼昆曾問過加爾布雷斯 (John K. Galbraith) 寫作成功的秘密;加爾布雷斯回答說,他寫的所有東西都會修改很多次,通常直到第五稿時才會基本滿意。下面分別介紹論文的各個部分。

(1)標題、關鍵字、摘要

論文的首頁通常包括標題、作者、摘要、關鍵字等信息。標題 (title) 是論文的標籤,正如商品的商標或名稱。一般應選擇簡潔而有吸引力的標題,並能讓讀者知道該文主要做什麼。在論文寫作乃至成文之後,都有可能修改論文題目,使之更為貼切有趣。

在題目之下一般為作者姓名,而將具體的作者單位、聯繫方式、感謝語 (包括基金資助) 以及 「文責自負」 等聲明放在腳註里。如果有多位作者,一般需選擇其中一位作者作為 「通訊作者」 (corresponding author),負責投稿並與編輯部保持聯繫 。

在題目與作者之下,一般為摘要 (abstract),通常在100字左右。摘要需突出論文的重要意義、研究方法與主要結論。一般讀者會先看摘要,再決定是否看全文。因此,論文摘要應字斟句酌,凸顯本文的主要貢獻,並激起讀者進一步閱讀的興趣。摘要通常在論文主體完成後才撰寫,因為此時作者對於論文的主要內容會有更清晰的概念。

在摘要的下面,通常還需提供幾個關鍵字 (key words),以便讀者能很快地根據關鍵字搜索到此文。關鍵字常常來自論文的題目。另外,在關鍵字之下,還可能提供 JEL 分類號,這是美國經濟學會主辦的 Journal of Economic Literature 雜誌所用的經濟學各領域的分類編號 。

經濟學實證論文的正文一般依次包括以下部分:引言、文獻回顧 (可歸入引言)、理論框架或背景介紹 (可省略)、數據說明、計量模型與估計方法、回歸結果、穩健性檢驗 (可歸入回歸結果)、結論。下面分別進行說明。

(2) 引言 (Introduction) 

引言雖是全文的第一部分,卻經常最後寫。原因之一,引言集中了全文的賣點 (selling points),最難撰寫,須反覆修改;原因之二,引言概括了全文的內容,只有在全文大體完工後,才能準確地總結與提煉。

引言通常包括以下內容:本文研究了什麼問題,此問題為什麼重要 (研究意義);本文使用了什麼數據 (最好在數據來源上有所創新或挖掘),實證研究的計量方法是什麼,得到了哪些主要結論;此研究與已有文獻的關係,本文的主要創新與邊際貢獻等。由此可見,引言將論文的精華部分以非技術性的方式呈現給讀者,可視為擴展版的摘要,是 「銷售」 此文的重要手段。事實上,許多讀者在瀏覽論文時,常常先看引言與結論,然後再決定是否細讀正文;可見引言的重要性。 

引言的寫作大致有兩個套路。傳統的套路是,在提出研究問題之後,首先回顧已有文獻的相關研究以及不足之處,然後順勢引出本文的研究方法與主要貢獻 (比如,填補了文獻的空白)。傳統套路的優點是,比較有邏輯性,能自然地呈現學術發展的脈絡;其缺點在於讀者需要有一定耐心,先回顧主要文獻,然後才知道本文的主要工作。

現代的套路是,提出問題之後,馬上直奔主題,介紹本文的研究方法與主要結論,然後再回頭介紹本研究與現有文獻的關係。這兩種套路各有優缺點,適合不同的論文,但直奔主題的現代套路似乎日益流行。

另外,引言的最後一段通常提供全文的路標 (roadmap),告訴讀者本文的其餘部分在結構上如何安排,以便於讀者閱讀。

(3) 文獻回顧 (Literature Review)

文獻回顧如果較短,可以歸入引言部分;反之,如果文獻回顧較長,則可單獨作為論文的一個部分。對於文獻的回顧一般按文獻出現的時間先後進行,著重介紹重要的文獻,而其他文獻可以簡略介紹、放入腳註,甚至略去。

文獻回顧的寫作切忌只是堆砌羅列一些文獻,而未進行深入分析。事實上,文獻回顧的根本目的是為了釐清本文的研究與已有文獻的關係,以凸顯本文的邊際貢獻及其在文獻中的地位。

為此,在肯定現有文獻的原創貢獻外,難免會指出其不足之處 (或被忽略的方面)。此時,應注意語氣委婉,因為這些文獻的作者有可能正是未來的審稿人或編輯。另一方面,你又希望突出本文的獨特貢獻 (當然必須實事求是)。因此,在指出現有文獻的不足與突出本文的貢獻之間,需要找到措辭與語調上的平衡。

(4) 背景介紹 (Background Information) 或理論框架 (Theoretical Framework)

 

實證論文並非僅僅是找一堆數據,然後彙報回歸結果。只有告訴讀者有關經濟現象的背景,完整地述說一個經濟故事,才能使得計量結果更有說服力。

比如,Nunn and Qian (2011) 研究引入 「新世界」 (New World) 作物土豆對 「舊世界」 (Old World) 人口增長與城市化的影響,在其第二節背景部分,即以大量篇幅介紹土豆的優點 (virtues of the potato)、土豆如何從新世界傳播到舊世界,以及其他新世界作物。因此,實證研究者的工作並不僅僅是下載數據進行回歸,還需要熟悉所研究現象的歷史、制度與文化背景,乃至數據的來源與產生過程。

如果可能,在此部分可引入一個簡單的理論模型 (theoretical model) 或思想框架(conceptual framework),為後續的實證研究提供理論基礎。但對於實證論文而言,其理論部分不宜太過複雜,以致喧賓奪主。另外,如果經濟現象過於複雜,沒有現成的理論,也可根據常識 (common sense) 直接寫下計量模型或回歸方程。

(5) 數據說明 (Data description)

實證論文的結論是否可靠,首先取決於數據的質量。因此,在數據說明部分,應詳細說明數據的具體來源,並評估其可靠性。介紹數據來源的詳細程度,應使讀者能按圖索驥得到同樣的數據,以保證科學結果的可重複性。

如果對原始數據進行了一些處理或加工,也應一一說明。如果學術界對於數據的質量有質疑,則應說明這些潛在的數據質量問題,對於你的研究有何影響。比如,GDP的絕對水平可能被誇大了,而你僅使用 GDP 的增長率,故可能影響不大。如果數據來自問卷調查,則應說明隨機抽樣如何進行,問卷如何發放與執行等,並在附錄中附上具體的問卷。

介紹數據來源之後,通常以表格形式給出主要變數的統計特徵 (summary of statistics),比如樣本容量、均值、標準差、最小值、最大值等,使讀者對數據的基本特徵有所了解。有時,還會提供關鍵變數的相關係數矩陣 (matrix of correlation),作為對變數之間關係的初步證據。

(6) 計量模型與估計方法 (Econometric model and estimation)

在此部分,需要結合所研究的問題以及已有數據,給出具體的計量模型,即回歸方程。通常會有一個基準 (baseline 或 benchmark) 的計量模型,然後在此基礎上對模型設定 (model specification) 有所變化,比如增加或替換變數。

此部分著重需說明論文的估計策略 (estimation strategy),即究竟應使用什麼計量方法來識別主要變數之間的因果關係。初學者易犯的錯誤是,在論文中直接使用某計量方法,而未說明為什麼這是最合適的計量方法。任何計量方法都有適用的前提條件,需要研究者仔細甄別與判斷。如果有兩個計量方法,各有優缺點,則可二者都用,然後作為穩健性檢驗,比較二者的結果。

(7) 回歸結果 (Regression results)

介紹計量方法之後,即可彙報回歸結果,通常以表格形式來呈現,主要包括以下信息:被解釋變數與解釋變數的名稱、回歸係數估計值、標準誤 (或 t 統計量),以星號表示統計顯著性,以及相關的統計量 (樣本容量、擬合優度等)。在正文中,需要對回歸結果進行解讀,包括回歸係數的統計顯著性與經濟顯著性,符號是否與理論預期相符等。

(8) 穩健性檢驗 (Robustness checks)

在實證論文中僅僅彙報一個回歸結果顯然是不夠的,因為變數的顯著性可能在不同的模型設定下變化。只有在不同的模型設定下,都能得到類似的結果,才是穩健與可信的。對於穩健性檢驗的結果彙報,如果篇幅比較短,可歸入上一部分的 「回歸結果」;反之,如果做了較多的穩健性檢驗,則可單獨作為論文的一個部分。

(9) 結論 (Conclusion)

結論是論文的最後部分,對全文所作工作進行總結,並給讀者留下最後的印象。結論部分通常概要地回顧本文的研究問題、計量方法與主要結論,也可重申本文的獨特貢獻。由於任何論文都有局限性,故也可指出未來的改進空間與研究方向。許多讀者會先看引言與結論,再決定是否看正文,故結論部分也十分重要。

(10)參考文獻 (References)

幾乎所有研究都建立在前人成果之上,故必然會在文中引用他人的論文或著作。這些論著的詳細出處,則一般收集於文末的參考文獻。需要特別注意的是,文中所有引用的論著,都應包括在參考文獻中;反之,所有參考文獻中的論著,都應在正文中被引用。

參考文獻的順序一般按照作者姓氏的字母 (拼音) 進行排列,對於同一作者的作品則按發表年代排序。另外,不同期刊對於參考文獻的具體格式也有不同要求;在投稿前需按所投期刊的要求進行修改。

(11)附錄 (Appendix)

有些論文還有附錄,主要收集不影響正文閱讀,但篇幅較長的細節。比如,對於理論文章,可能把繁瑣的證明放在附錄。而對於實證論文,有時會把過長的數據說明放在附錄。如果數據來自問卷調查,則通常把具體的問卷放在附錄。

(12)寫作風格

經濟學論文屬於科學類的論文,並不需要過於華麗的詞藻,而應首先注意行文的簡潔與邏輯性。另一方面,優美流暢的文筆對於提高論文可讀性、吸引讀者注意力十分重要。

對於初次寫論文者,首先要注意 「書面語」 與 「口語」 的區別,避免過分口語化;不能嘴上怎麼說,筆下就怎麼寫,而應使用更為洗鍊到位的書面語言。在下筆之前,可先在腦海里構思文章的結構與寫作風格。事實上,寫作的過程也是使思路更加清晰的過程。

對於論文中的方程式,可使用 Word 文檔中的 「insert」 →  「object」 → 「Microsoft Equations」 進行編輯,使得方程更為美觀 。論文中所有單獨成行的方程式,都應按順序編號,以(1)、(2)、(3)等表示,以便於檢索。

對於論文中的表格與圖片,也應注意其格式。一般來說,表格的標題應在表的上方;而圖片的標題則在圖的下方。在表格或圖片的下方,還可以有注釋,說明數據來源、變數定義等相關信息。

對於初學者,建議仔細觀察經典論文的文章結構與風格,並注意模仿。比如,中文論文可以模仿《經濟研究》或《經濟學季刊》,而英文論文則可參照 American Economic Review, Journal of Political Economy, Quarterly Journal of Economics 等。正如古語所云,「熟讀唐詩三百首,不會作詩也會吟」。

12、與同行交流

論文初稿完成後,通常不宜直接投稿,或作為畢業論文提交。這是因為,在研究與寫作過程中,難免受到個人先入為主的主觀限制,出現這樣或那樣的偏差或疏忽。因此,懇請導師、同行或朋友閱讀你的論文,並提出批評與修改意見,是十分必要的。

更正式的渠道包括將論文提交至學術會議,或應邀到相關學術機構作報告;以便收集有益反饋,然後進一步修改論文。當代論文的複雜程度越來越高,需要考慮的問題也越來越多,如果一味閉門造車則難免掛一漏萬,難以保證論文的高質量。

13、提交論文或投稿

經過與同行交流並將論文修改完善後,可考慮提交畢業論文,或將論文投稿到合適的期刊。在選擇期刊時,首先要評估論文的重要性與質量,即該文是否研究了一個重要或有趣的問題,以及所用方法是否嚴格、結論是否可信;然後再將論文投給相應檔次的期刊。

這裡所說的 「重要」,並不一定非要是影響國計民生的重大課題,也可以只有學術上的意義。即使只是一個有趣的小問題,如果使用了嚴格的研究方法,也可能很有價值。反之,如果研究方法有漏洞,即便研究的是大問題,也可能大而無當。

如果不清楚論文該投給哪個雜誌,可請教導師或有投稿經驗的前輩。在投稿時,切忌 「一稿多投」,即將一篇稿件同時投給多個雜誌,造成編輯部的審稿資源浪費。這是投稿的基本規則;如果違背,可能導致嚴重的後果。一般來說,只有在被拒稿或主動撤稿之後,才能將稿件投給另外一個期刊。

期刊編輯部在收到稿件後 (通常為電子投稿),一般由主編 (editor) 或共同主編 (co-editor) 先行瀏覽,並決定是否送外審;如果不送外審,則會直接在案頭拒稿 (desk reject)。對於送外審的論文,主編通常選擇2-3位匿名審稿人 (anonymous referee) 進行審稿,並要求在規定的時間內 (比如一個月或更長時間) 提交審稿人報告 (referee report)。

有時匿名審稿人也不知道論文作者的身份,這稱為 「雙向匿名審稿」 (double-blind review)。然而,在互聯網時代,審稿人通常不難查到作者身份 (很多作者會把工作論文掛在網上),雙向盲審也就失去了意義。為此,American Economic Review 從2011年開始改用 「單向匿名審稿」 (single-blind review),即作者不知道審稿人身份,而審稿人知道作者身份。

主編在收到全部審稿人報告後,通常根據這些審稿意見,對論文採取以下決定:(1) 直接接受;(2) 直接拒稿;(3) 修改再投 (Revise and Resubmit,簡記 R&R)。一般來說,第一種情況 (直接接受) 非常少見,而第三種情況則說明此稿件有希望發表,應根據審稿人的建議進行認真修改。有時,「修改再投」 可能會發生 2-3 輪,而且越是頂尖的期刊,修改再投後被拒稿的可能性越大。

總之,從論文投稿到期刊發表,即使在最順利的情況下,也通常需要一年時間 (除非編輯部對重要稿件加急處理);而英文期刊的發表周期則可能更加漫長。在此期間,還可能需要幾經修改,甚至轉投多個期刊。這時你會發現,寫論文並不難,難的是發表論文。唯有切實提高論文質量,才是發表論文的根本保證。

14、寫作倫理

在論文寫作過程中,應特別注意引用的規範性,並杜絕抄襲。究竟 「引用」 (citation) 與 「抄襲」 (plagiarism) 有何區別?

二者最本質的區別在於,引用給出了信息的出處;而抄襲未提供出處,讓讀者誤以為是作者的原創。抄襲可以定義為 「將已經存在的思想或產品『偷來』作為自己的思想或產品」 (The Modern Language Association of America, 2009, p. 52)。

抄襲是一種嚴重違背學術規範與職業道德的行為,可能導致無可挽回的嚴重後果。首先,它將別人的思想佔為己有,等於 「偷竊」 了別人的知識產品;其次,將別人的知識產品作為自己的成果發表以獲得好處,這等同於 「欺詐」 (fraud)。

為此,初學者在使用別人的研究成果時,一定要注意通過正確的引用來註明出處。如果直接引言別人的原話,應加上雙引號,並註明文獻來源。如果大段地複製已有文獻而未標明出處,則為赤裸裸的抄襲,應堅決杜絕。即使是間接引用,比如用簡潔的語言概述前人的思想,或將已有模型作了小的改動,也應及時註明其出處。

15、結語

如何才能做出高水平的實證研究?如何才能寫出高質量的經濟學論文?更進一步,如何才能成為好的經濟學家或經濟工作者?顯然,要達到這些目的,絕非單一學科 (比如,計量經濟學) 就能勝任,而需要全方位的學識與素養。在此,引用凱恩斯的一段話作為結束語,並與大家共勉 (曼昆,2009,p.39):

經濟學研究似乎並不需要任何極高的特殊天賦。與更高深的哲學或純科學相比,經濟學不是……一門極其容易的學科嗎?一門容易的學科,但這個學科中很少有人能出類拔萃!這個悖論的解釋也許在於傑出的經濟學家應該具有各種天賦的罕見的結合。在某種程度上,他應該是數學家、歷史學家、政治家和哲學家。他必須了解符號並用文字表達出來。他必須根據一般性來深入思考特殊性,並在思緒奔放的同時觸及抽象與具體。他必須根據過去、為著未來而研究現在。他必須考慮到人性或人的制度的每一部分。他必須同時保持果斷而客觀的情緒,像藝術家一樣冷漠而不流俗,但有時又要像政治家一樣腳踏實地。 

參考文獻

Heckman, James, 2000. 「Causal Parameters and Policy Analysis in Economics: A Twentieth-Century Retrospective,」 Quarterly Journal of Economics, 115, 45-97. 

Lin, Justin Yifu, 1992. 「Rural Reforms and Agricultural Growth in China, 」 American Economic Review, 82, 34-51.

The Modern Language Association of America, 2009. MLA Handbook for Writers of Research Papers, 9th edition, New York. 

Nunn, Nathan, and Nancy Qian, 2011. 「The Potato"s Contribution to Population and Urbanization: Evidence from a Historical Experiment,」 Quarterly Journal of Economics, 126, 593-650.

林毅夫,《經濟學研究方法和中國經濟學科發展》,《經濟研究》,2001年,第4期。

[美] 曼昆,《經濟學原理:微觀經濟學分冊》,第5版,梁小民、梁礫譯,北京大學出版社,2009年。

錢穎一,《理解現代經濟學》,《經濟社會體制比較》,2002年,第2期。

    (本文內容主要節選自《計量經濟學及Stata應用》,陳強,山東大學經濟學院,2015,第15章)


推薦閱讀:

支付方式的歷史變遷
富豪徵婚的經濟學分析
005 2025年,日本的未來。
OECD成員國哪個國家人均收入GDP最高?
【推薦書單】想要入門經濟學,這些書不得不看

TAG:論文 | 經濟學 | 經濟 | 寫作 | 計量經濟學 | 論文寫作 | 計量經濟 | 計量 | 解析 | 實證 |