如何正確運用計量經濟模型進行實證分析
(作者於曉華,為德國哥廷根大學農業經濟和農村發展系教授)
計量經濟學作為實證分析的主要手法,已經被中國廣大經濟研究者接受。但是,正確運用計量經濟模型,得出一個穩定、合理以及可靠的參數估計值,還沒有一個很好的系統梳理。
由於計量經濟學的統計學基礎,不正確使用計量經濟模型,可能會使估計結果不穩健,從而產生「變色龍」一樣的實證結果,導致實證結果的政策分析被廣受質疑。
本文從數據、模型和參數等3個角度出發,分析應用計量經濟學模型在實證分析中要注意的問題:
首先,數據是進行實證分析的基礎。數據按照來源,可以劃分為微觀調研數據、機構統計數據以及實驗數據。在廣為使用的調研數據和統計數據中,系統性誤差包括測量誤差和樣本選擇常常存在。如果無視這些誤差,可能使估計結果不能滿足一致性。如果數據存在系統性測量誤差,工具變數方法通常是主要的解決方案;如果數據存在系統性的樣本選擇問題,Heckman方法是廣為使用的校正方法。
其次,從模型的角度來說,任何模型都包括環境假設、機制以及求解3個組成部分。其中,環境假設對計量經濟模型的正確使用尤為重要。在運用計量模型時,必須要清楚了解他們的假設條件,並對這些條件作必要的檢查和檢驗。計量經濟模型區別於統計模型最重要的假設:變數的外生性、許多因素可以造成變數內生性問題。工具變數是對內生性常見的檢驗和校正方法。可是有些研究中,工具變數無從尋找,就必須要依靠實驗經濟學的方法。
偽回歸在計量分析中也不鮮見。偽回歸可能是由模型本身原因造成的,也可能是數據結構造成的。計量經濟學是結合了經濟學理論和統計學的定量分析方法,沒有經濟學理論基礎的計量經濟分析,很可能會導致偽回歸結果。某些特殊的數據結構,如非平穩的時間序列或非平穩的空間數據,都可能導致偽回歸結果。
再次,計量經濟學的基礎雖然是統計學,但是兩者之間還存在一些差異。由於技術上的限制,現有的計量經濟模型的檢驗還是基於統計檢驗,所謂「顯著性」都是統計上的顯著性,這不同於「經濟上的顯著性」。在實證分析中,在討論估計參數在統計上顯著性的時候,也必須要討論經濟上的顯著性,後者有時可能更重要。
最後,計量經濟學的估計結果通常會被運用到政策分析中去,但是Lucas批判(1976)認為參數的估計值可能會隨著政策的變化而變化,使計量經濟學無法為政策分析服務。為了應對Lucas批判,計量經濟學家提出了變數超級外生性的概念。條件於超級外生的變數,數據產生機制對估計參數結果沒有影響,這時的政策分析才有意義。
計量經濟學論文的寫作方法
——基於實證研究的視角
(作者:鍾經樊 台灣中央研究院 經濟研究所教授)
學習計量經濟學的最後目的是為進行實證研究,但對初學計量經濟學的人而言,要寫一篇有實證研究的報告或論文時常有不知如何著手的感覺,這裡我便對實證研究的規劃以及論文的寫作做一些粗淺的建議。
前期規劃:
1.廣泛收集參考文獻,決定計劃的目的和範疇:
決定所要解釋的現象是什麼?
決定所要檢驗的假設或理論是什麼?
決定所要預測的趨勢是什麼?
決定所要評估的政策是什麼?
2.建構實證計量模型:
除研讀相關經濟理論之外,應比較三至五篇有實證分析之文獻中的實證計量模型;
確認計量模型中解釋變數和應變數之間的因果關係(causality);
理清各模型的異同及優缺點,思考改進文獻中現存模型的可能;
最後決定實證計量模型雛形;
初步調查是否有相關的資料,若無則實證模型設計的再好也無用。
3.收集相關資料
對數據的精確性一定要嚴格查核,對錯假漏數據要仔細修正;
使用電子表格軟體對數據列表繪圖,以驗證數據的邏輯合理性,對不合理的數值要有所處理;
不論要用的是橫斷面數據或是時間數列,數據數目越多越好,面板數據(Panel Data)尤佳;
對資料數值作一些整理,表列各種基本統計量(樣本平均值、變異數、變數間的樣本相關係數等)、變數之間的兩兩交互列表、做一些初步圖解分析。
計量方法的執行:
1.計量方法不應太簡單(例如只做到最簡單的OLS),但也不必過於複雜,應針對問題採用恰到好處的計量方法。若採用了比較複雜的計量方法,則要說明為什麼簡單的方法不適合。計量方法的好壞不在其複雜程度,而在於它是否能夠幫我們得到正確的估計值,以了解數據中所包含的真正信息。
2.除了估計值以及對應的 t 檢定外外,也可做一些 F 檢定之對多個係數的假設檢定。
3.回歸模型的設定,尤其是解釋變數的取捨,可在估計過程中不斷的修正。對應變數和解釋變數均可嘗試諸如對數、指數、冪函數等不同的轉換。這些轉換方式的決定,以經濟理論上的考慮最為重要,不能單只為了提高模型的配適,而盲目的做一些不合理的變數轉換。
4.選取解釋變數時,應有如下的考慮:
解釋變數和應變數之間的因果關係一定要正確,也就是說,解釋變數是原因在先,應變數是結果在後,有一定的先後順序。尤其要注意,有些變數數值的產生很可能是和應變數同時決定的,或是因果關係不很明確(也就是說,相對於應變數而言,這些變數是內生的),則在選取這些變數作為解釋變數時,便要非常小心。解釋變數的內生問題常常是研究被批評的主要原因;
要注意解釋變數的同構型,不能不分青紅皂白的將一大堆彼此相關性很高的變數(包括相同變數的不同轉換、或是幾個變數間的各種交乘項)放進回歸式內,造成嚴重的線性重合問題;
經濟理論所牽涉到的變數常常是無法觀察到的,因此在做實證研究時必須採用替代變數(Proxy),研究者要對所選用之替代變數的合理性詳加說明。由於數據總有些缺失,常有人在束手無策之下,採用了很多匪夷所思的替代變數;
虛擬變數的定義要清楚而合理,使用要小心;
要探討解釋變數不足、觀察值有誤差等數據缺失所可能造成的計量問題。
5.橫斷面數據要注意異方差(Heteroscedasticity)的問題,時間數列的數據則要注意干擾項自我相關(Autocorrelation)的問題。要確定時間數列的穩定性(Stationarity),若有季節變動也要加以處理。
6.模型的穩定性要注意,可能需要諸如 Chow Test 或 CumSum Test 的檢驗。
7.若用到 MLE 或 GMM等非線性計算,則在撰寫報告時要對數值方法的細節,諸如統計軟體及數值方法的名稱、起始值之選取、收斂速度、是否產生區域解(localsolution)、收斂條件的設定等,均需有所說明。
8.若實證模型中有多個應變數(和對應之方程式)值得同時分析,則可考慮採用 Seeming unrelated regression甚至聯立回歸模型等系統模型,以更有效的利用各回歸式之間的相關性。
報告的寫作:
1.首頁:報告題目,作者名字,系所,學號,日期。
2.摘要:對全文宗旨作一簡單描述,並簡述文章的目的是對經濟結構的分析,還是對未來趨勢的預測,還是對政策的評估;然後簡單介紹所使用的模型及變數,數據的種類及來源,所估計的模型,所採用的計量方法;最後以最主要的實證結果為終結。
3.緒論:說明研究的性質、範圍和目的,並從不同角度或一個比較寬廣的視野(歷史、社會、文獻、問題嚴重性等)來解釋研究的重要性。
4.文獻回顧:對和主題有直接和間接關係的文獻做一個簡單清楚有系統的回顧,和主題有直接關係但有不同結果的文獻,更是要有比較完整的解釋。
5.模型設定:模型有理論模型和實證模型兩類。理論模型是從經濟理論中直接導出,而實證模型則是從理論模型衍申出來,是要實際以資料來估計的。理論模型通常需以數學推導,因此文章中可列出一些關鍵的數式以幫助理論的闡述,但不應長篇累牘的堆積只有間接關係的數式。實證模型通常是以回歸模型的形式表示,對模型中所涉及的變數均須給與明確的定義,對解釋變數和應變數之間的關係要詳盡的說明,也要解釋對模型中主要係數(或由這些係數所導出之彈性、乘數等)可能數值的大小及符號有怎樣的理論預期。
6.資料說明:對數據的種類,性質,來源出處,數據修訂的方式,數據中可能有的錯誤和缺失,都要有詳細的說明,最好也能將資料的基本統計量表列出來。
7.計量方法的描述:對所用到的每一個符號都要有清楚的定義。
8.實證結果的報告:
係數估計的主要結果均須以表列出,在表中每一係數對應之變數名稱要寫清楚,每一係數估計值旁均須伴隨一標準差(s.e.)或 t統計量,也可加列 p 值,對於顯著的估計值也可附加諸如星號之特殊標記以提醒讀者。顯示模型整體表現的統計量,諸如 R2(線性回歸模型),F 檢定統計量, Durbin-Watson檢定統計量(對時間數列資料),也可選擇性的列於表內。在表的腳註中,必須說明表中所有的特殊符號和簡稱,表中變數名稱的選取,應盡量採用有意義的中文簡稱,少用無意義的英文字母組合。製表的基本原則就是要讓讀者便捷、完整而清楚的了解估計的結果;
對主要回歸係數(或由回歸係數所導出之彈性、乘數等)估計值的大小、符號及顯著與否要詳加討論,對於顯著的估計值更要和理論預期值比較,若有明顯的矛盾,則要探討原因;
若能在文獻中找到類似模型的估計結果,則應擇要報告,並做比較;
對重要回歸係數若是得不到顯著的估計值,則要探討其中原因。也絕不能對不顯著的估計值做出過度的解釋,尤其不能宣稱不顯著的估計值支持或不支持某些特定結論。我們要知道估計值不顯著,就是表示所使用的數據不能夠提供足夠的信息,若是沒有足夠的信息,當然不能夠也不應該做出任何確切的結論;
為增加文章的清晰度,能夠條列的結果應盡量條列(但要注意條列式的闡述易流於機械化而讓讀者失去興趣),同樣的,能夠列表的結果應盡量列表,表格應儘可能的明確、獨立自主而自成一體(多利用表格下端的附註詳加解釋表格的內容),儘可能讓讀者不用在文章中到處找相關說明。此外,圖表也是一個非常精準有效之傳達信息的方式,應多加利用;
所有具有政策意義的重要論點都要經過假設檢定的嚴謹統計程序探討其顯著性;
若要根據估計模型對數據外的時期或狀況進行預測,則態度必須保守謹慎,儘可能設想預測可能不準的原因;
所有列舉的統計數字應盡量保持統一的小數點位數(小數點後三位數或四位數均可),如果有很小或很大的數字,則可以用科學表示法表示(例如1.2345 x 10-4),儘可能顯示出三至五位有效數字。
9.結論:對所有重要結果做一個完整的總結,並經由理論或數據中不盡完美處的討論,指明未來研究的方向。
10.列舉參考文獻。
一些注意事項:
1.正確的進行研究很重要,但如何將研究結果有條有理、完整而正確的寫成報告則更是重要。由於大學教育並不重視國文(英文)寫作的訓練,很多學期報告的問題都在於國文(英文)的寫作。所以對報告主體完成後的文字修飾工作,一定要給與很大的重視。
2.寫論文應該抱持著推銷產品的心態,所以在包裝產品(即寫文章)之前要清楚的了解顧客(讀者)的基本心理:顧客基本上是報著不太關心但走著瞧的心理,所以寫文章時,便要時時設想如何能在非常短的時間內讓顧客對產品發生興趣,當然也要設想如何能讓他們在將產品消化後能對產品讚不絕口。
3.大家都知道文章中每一個章節都有一個主題(章節的標題就是用來點明該主題的),但很多人似乎是不知道,文章中的每一個段落也有各自的主題,也就是說每一個段落只是用來說明一件事情的。很多人常在該分段的時候不分,以致一個段落中常擠進兩三個不太相關連的主題,而讓讀者不易掌握文章重點。
4.相對的另一個問題是,同一個主題,也應該在同一個地方講清楚,而不應該在文章中不同的地方重複出現(在序論及結論中對各主題之概論則例外),尤其是不應該在不同的地方出現互相矛盾的說法。但有時候在對一個主題的解釋過程中,可能需要先了解一些其它的概念,因此有必要將一個主題的解釋,分置於文章中兩個不同的段落。若如此則在前一部份解釋完成後,應預先告知往後還會有更多的說明。這種做法既讓讀者有一個全盤瞭然的感覺,也提醒自己在前後不同地方的說明要彼此呼應而不重複或矛盾。
作者:於曉華、鍾經樊
推薦閱讀:
※綠瘦率先提出「數據驅動創新」理念 為實體經濟發展貢獻力量?
※中國迎來第三次移民潮,對美經濟產生新衝擊
※眯會兒車載共享按摩墊-追求極致的舒適度
※自由的阿甘 2017 年 01 月 25 日的文章
※為什麼現在的90後不想加班和買房?