如何寫第一篇經濟學實證研究論文

06-13

如何寫第一篇經濟學實證研究論文2006/07/14 經濟學俱樂部

　　　<< 回首頁

學習計量經濟學的最後目的是為進行實證研究，但對初學計量經濟學的人而言，要寫一篇有實證研究的報告或論文時常有不知如何著手的感覺，這裡我便對實證研究的規劃以及論文的寫作做一些粗淺的建議。前期規劃： 1. 廣泛收集參考文獻，決定計劃的目的和範疇： · 決定所要解釋的現象是什麼？ · 決定所要檢驗的假設或理論是什麼？ · 決定所要預測的趨勢是什麼？ · 決定所要評估的政策是什麼？ 2. 建構實證計量模型； · 除研讀相關經濟理論之外，應比較三至五篇有實證分析之文獻中的實證計量模型： § 確認計量模型中解釋變數和應變數之間的因果關係（causality）； § 釐清各模型的異同及優缺點，思考改進文獻中現存模型的可能； § 最後決定實證計量模型雛形； · 初步調查是否有相關的資料，若無則實證模型設計的再好也無用。 3. 收集相關資料； · 對資料的精確性一定要嚴格查核，對錯假漏資料要仔細修正； · 使用電子表格軟體對資料列表繪圖，以驗證資料的邏輯合理性，對不合理的數值要有所處理； · 不論要用的是橫斷面資料或是時間數列，資料數目越多越好，追蹤資料（Panel Data）尤佳； · 對數據數值作一些整理，表列各種基本統計量（樣本平均值、變異數、變數間的樣本相關係數等）、變數之間的兩兩交互列表、做一些初步圖解分析。計量方法的執行： 1. 計量方法不應太簡單（例如只做到最簡單的 OLS），但也不必過於複雜，應針對問題採用恰到好處的計量方法。若採用了比較複雜的計量方法，則要說明為什麼簡單的方法不適合。計量方法的好壞不在其複雜程度，而在於它是否能夠幫我們得到正確的估計值，以了解資料中所包含的真正信息。 2. 除了估計值以及對應的 t 檢定外外，也可做一些 F 檢定之對多個係數的假設檢定。 3. 回歸模型的設定，尤其是解釋變數的取捨，可在估計過程中不斷的修正。對應變數和解釋變數均可嘗試諸如對數、指數、冪函數等不同的轉換。這些轉換方式的決定，以經濟理論上的考量最為重要，不能單只為了提高模型的配適，而盲目的做一些不合理的變數轉換。 4. 選取解釋變數時，應有如下的考量： · 解釋變數和應變數之間的因果關係一定要正確，也就是說，解釋變數是原因在先，應變數是結果在後，有一定的先後順序。尤其要注意，有些變數數值的產生很可能是和應變數同時決定的，或是因果關係不很明確（也就是說，相對於應變數而言，這些變數是內生的），則在選取這些變數作為解釋變數時，便要非常小心。解釋變數的內生問題常常是研究被批評的主要原因； · 要注意解釋變數的同構型，不能不分青紅皂白的將一大堆彼此相關性很高的變數（包括相同變數的不同轉換、或是幾個變數間的各種交乘項）放進回歸式內，造成嚴重的線性重合問題； · 經濟理論所牽涉到的變數常常是無法觀察到的，因此在做實證研究時必須採用替代變數（Proxy），研究者要對所選用之替代變數的合理性詳加說明。由於數據總有些缺失，常有人在束手無策之下，採用了很多匪夷所思的替代變數； · 虛擬變數的定義要清楚而合理，使用要小心； · 要探討解釋變數不足、觀察值有誤差等資料缺失所可能造成的計量問題。 5. 橫斷面資料要注意干擾項不均齊變異（Heteroscedasticity）的問題，時間數列的資料則要注意干擾項自我相關（Autocorrelation）的問題。要確定時間數列的穩定性（Stationarity），若有季節變動也要加以處理。 6. 模型的穩定性要注意，可能需要諸如 Chow Test 或 CumSum Test 的檢驗。 7. 若用到 MLE 或 GMM 等非線性計算，則在撰寫報告時要對數值方法的細節，諸如統計軟體及數值方法的名稱、起始值之選醛收斂速度、是否產生區域解（local solution）、收斂條件的設定等，均需有所說明。 8. 若實證模型中有多個應變數（和對應之方程式）值得同時分析，則可考慮採用 Seeming unrelated regression 甚至聯立回歸模型等系統模型，以更有效的利用各回歸式之間的相關性。報告的寫作： 1. 首頁：報告題目，作者名字，系所，學號，日期。 2. 摘要：對全文宗旨作一簡單描述，並簡述文章的目的是對經濟結構的分析，還是對未來趨勢的預測，還是對政策的評估；然後簡單介紹所使用的模型及變數，資料的種類及來源，所估計的模型，所採用的計量方法；最後以最主要的實證結果為終結。 3. 緒論：說明研究的性質、範圍和目的，並從不同角度或一個比較寬廣的視野（歷史、社會、文獻、問題嚴重性等）來解釋研究的重要性。 4. 文獻回顧：對和主題有直接和間接關係的文獻做一個簡單清楚有系統的回顧，和主題有直接關係但有不同結果的文獻，更是要有比較完整的解釋。 5. 模型設定：模型有理論模型和實證模型兩類。理論模型是從經濟理論中直接導出，而實證模型則是從理論模型衍申出來，是要實際以資料來估計的。理論模型通常需以數學推導，因此文章中可列出一些關鍵的數式以幫助理論的闡述，但不應長篇累牘的堆積只有間接關係的數式。實證模型通常是以回歸模型的形式表示，對模型中所涉及的變數均須給與明確的定義，對解釋變數和應變數之間的關係要詳盡的說明，也要解釋對模型中主要係數（或由這些係數所導出之彈性、乘數等）可能數值的大小及符號有怎樣的理論預期。 6. 資料說明：對資料的種類，性質，來源出處，資料修訂的方式，資料中可能有的錯誤和缺失，都要有詳細的說明，最好也能將資料的基本統計量表列出來。 7. 計量方法的描述：對所用到的每一個符號都要有清楚的定義。 8. 實證結果的報告： · 係數估計的主要結果均須以表列出，在表中每一係數對應之變數名稱要寫清楚，每一係數估計值旁均須伴隨一標準差（s.e.）或 t 統計量，也可加列 p 值，對於顯著的估計值也可附加諸如星號之特殊標記以提醒讀者。顯示模型整體表現的統計量，諸如 R2（線性回歸模型）， F 檢定統計量， Durbin-Watson 檢定統計量（對時間數列資料），也可選擇性的列於表內。在表的腳註中，必須說明表中所有的特殊符號和簡稱，表中變數名稱的選取，應盡量採用有意義的中文簡稱，少用無意義的英文字母組合。製表的基本原則就是要讓讀者便捷、完整而清楚的了解估計的結果； · 對主要回歸係數（或由回歸係數所導出之彈性、乘數等）估計值的大些符號及顯著與否要詳加討論，對於顯著的估計值更要和理論預期值比較，若有明顯的矛盾，則要探討原因； · 若能在文獻中找到類似模型的估計結果，則應擇要報告，並做比較； · 對重要回歸係數若是得不到顯著的估計值，則要探討其中原因。也絕不能對不顯著的估計值做出過度的解釋，尤其不能宣稱不顯著的估計值支持或不支持某些特定結論。我們要知道估計值不顯著，就是表示所使用的資料不能夠提供足夠的信息，若是沒有足夠的信息，當然不能夠也不應該做出任何確切的結論； · 為增加文章的清晰度，能夠條列的結果應盡量條列（但要注意條列式的闡述易流於機械化而讓讀者失去興趣），同樣的，能夠列表的結果應盡量列表，表格應儘可能的明確、獨立自主而自成一體（多利用表格下端的附註詳加解釋表格的內容），儘可能讓讀者不用在文章中到處找相關說明。此外，圖表也是一個非常精準有效之傳達信息的方式，應多加利用； · 所有具有政策意義的重要論點都要經過假設檢定的嚴謹統計程序探討其顯著性； · 若要根據估計模型對資料外的時期或狀況進行預測，則態度必須保守謹慎，儘可能設想預測可能不準的原因； · 所有列舉的統計數字應盡量保持統一的小數點位數（小數點後三位數或四位數均可），如果有很小或很大的數字，則可以用科學表示法表示（例如 1.2345 x 10-4），儘可能顯示出三至五位有效數字。 9. 結論：對所有重要結果做一個完整的總結，並經由理論或資料中不盡完美處的討論，指明未來研究的方向。 10. 列舉參考文獻。一些注意事項： 1. 正確的進行研究很重要，但如何將研究結果有條有理、完整而正確的寫成報告則更是重要。由於大學教育並不重視國文（英文）寫作的訓練，很多學期報告的問題都在於國文（英文）的寫作。所以對報告主體完成後的文字修飾工作，一定要給與很大的重視。 2. 寫論文應該抱持著推銷產品的心態，所以在包裝產品（即寫文章）之前要清楚的了解顧客（讀者）的基本心理：顧客基本上是報著不太關心但走著瞧的心理，所以寫文章時，便要時時設想如何能在非常短的時間內讓顧客對產品發生興趣，當然也要設想如何能讓他們在將產品消化後能對產品讚不絕口。 3. 大家都知道文章中每一個章節都有一個主題（章節的標題就是用來點明該主題的），但很多人似乎是不知道，文章中的每一個段落也有各自的主題，也就是說每一個段落只是用來說明一件事情的。很多人常在該分段的時候不分，以致一個段落中常擠進兩三個不太相關連的主題，而讓讀者不易掌握文章重點。 4. 相對的另一個問題是，同一個主題，也應該在同一個地方講清楚，而不應該在文章中不同的地方重複出現（在序論及結論中對各主題之概論則例外），尤其是不應該在不同的地方出現互相矛盾的說法。但有時候在對一個主題的解釋過程中，可能需要先了解一些其它的概念，因此有必要將一個主題的解釋，分置於文章中兩個不同的段落。若如此則在前一部份解釋完成後，應預先告知往後還會有更多的說明。這種做法既讓讀者有一個全盤瞭然的感覺，也提醒自己在前後不同地方的說明要彼此呼應而不重複或矛盾。