應用計量經濟學的常見問題
不知從何時起,解答計量問題成了我日常生活的一部分。天南海北的讀者與同道提出了各種各樣的計量問題。這裡摘取少量的典型問題,希望對從事實證研究的朋友有幫助。
1、在什麼情況下,應將變數取對數再進行回歸?
答:可以考慮以下幾種情形。
第一,如果理論模型中的變數為對數形式,則應取對數。比如,在勞動經濟學中研究教育投資回報率的決定因素,通常以工資對數為被解釋變數,因為這是從Mincer模型推導出來的。
第二,如果變數有指數增長趨勢(exponential growth),比如 GDP,則一般取對數,使得 lnGDP 變為線性增長趨勢(linear growth)。第三,如果取對數可改進回歸模型的擬合優度(比如 R2 或顯著性),可考慮取對數。
第四,如果希望將回歸係數解釋為彈性或半彈性(即百分比變化),可將變數取對數。
第五,如果無法確定是否該取對數,可對兩種情形都進行估計,作為穩健性檢驗(robustnesscheck)。若二者的回歸結果類似,則說明結果是穩健的。
2、如何理解線性回歸模型中,交互項(interactive term)係數的經濟意義?
答:在線性回歸模型中,如果不存在交互項或平方項等非線性項,則某變數的回歸係數就表示該變數的邊際效應(marginal effect)。比如,考慮回歸方程
y = 1 + 2x + u
其中, u為隨機擾動項。顯然,變數x對 y 的邊際效應為 2,即 x 增加一單位,平均而言會使 y增加兩單位。考慮在模型中加入交互項,比如
y = α + βx + γz + δxz+ u
其中, x 與 z為解釋變數,而 xz為其交互項(交叉項)。由於交互項的存在,故x對 y 的邊際效應(求偏導數)為β + δz,這說明 x對 y的邊際效應並非常數,而依賴於另一變數z 的取值。如果交互項係數 δ為正數,則 x對 y的邊際效應隨著 z 的增加而增加(比如,勞動力的邊際產出正向地依賴於資本);反之,如果δ為負數,則 x對 y的邊際效應隨著z的增加而減少。
3、在一些期刊上看到回歸模型中引入控制變數。控制變數究竟起什麼作用,應該如何確定控制變數呢?
答:在研究中,通常有主要關心的變數,其係數稱為 「parameterof interest」 。但如果只對主要關心的變數進行回歸(極端情形為一元回歸),則容易存在遺漏變數偏差(omittedvariable bias),即遺漏變數與解釋變數相關。加入控制變數的主要目的,就是為了盡量避免遺漏變數偏差,故應包括影響被解釋變數 y 的主要因素(但允許遺漏與解釋變數不相關的變數)。
4、很多文獻中有 「穩健性檢驗」 小節,請問是否每篇實證都要做這個呢?具體怎麼操作?
答:如果你的論文只彙報一個回歸結果,別人是很難相信你的。所以,才需要多做幾個回歸,即穩健性檢驗(robustness checks)。沒有穩健性檢驗的論文很難發表到好期刊,因為不令人信服。穩健性檢驗方法包括變換函數形式、劃分子樣本、使用不同的計量方法等,可以參見我的教材。更重要的是,向同領域的經典文獻學習,並模仿其穩健性檢驗的做法。
5、對於面板數據,一定要進行固定效應、時間效應之類的推敲么?還是可以直接回歸?我看到很多文獻,有的說明了使用固定效應模型的原因,有的則直接回歸出結果,請問正確的方法是什麼?
答:規範的做法需要進行豪斯曼檢驗(Hausman test),在固定效應與隨機效應之間進行選擇。但由於固定效應比較常見,而且固定效應模型總是一致的(隨機效應模型則可能不一致),故有些研究者就直接做固定效應的估計。
對於時間效應也最好同時考慮,比如,加入時間虛擬變數或時間趨勢項;除非經過檢驗,發現不存在時間效應。如果不考慮時間效應,則你的結果可能不可信(或許x與 y的相關性只是因為二者都隨時間而增長)。
6、如何決定應使用二階段最小二乘法(2SLS)還是廣義矩估計(GMM)?
答:如果模型為恰好識別(即工具變數個數等於內生變數個數),則GMM完全等價於2SLS,故使用2SLS就夠了。在過度識別(工具變數多於內生變數)的情況下,GMM的優勢在於,它在異方差的情況下比2SLS更有效率。由於數據或多或少存在一點異方差,故在過度識別情況下,一般使用GMM。
7、在面板數據中,感興趣的變數x 不隨時間變化,是否只能進行隨機效應的估計(若使用固定效應,則不隨時間變化的關鍵變數 x 會被去掉)?
答:通常還是使用固定效應模型為好(當然,可進行正式的豪斯曼檢驗,以確定使用固定效應或隨機效應模型)。如果使用固定效應,有兩種可能的解決方法:
(1)如果使用系統GMM估計動態面板模型,則可以估計不隨時間而變的變數x 的係數。
(2)在使用靜態的面板固定效應模型時,可引入不隨時間而變的變數 x與某個隨時間而變的變數 z 之交互項,並以交互項 xz (隨時間而變)作為關鍵解釋變數。
8、對於非平穩序列,能否進行格蘭傑因果檢驗?
答:如果非平穩序列之間存在協整關係,則可進行格蘭傑因果檢驗(Grangercausality test)。這是因為,根據「格蘭傑表示法定理」(Granger Representation Theorem),任何協整系統都可寫為向量自回歸(VAR)模型,即格蘭傑因果檢驗的形式。
反之,如果非平穩序列之間不存在協整關係,則須先將原序列變為平穩過程(比如一階差分),然後再進行格蘭傑因果檢驗;否則會出現「偽回歸」(spuriousregression)問題。
9、對於面板數據,如何進行格蘭傑因果檢驗?
答:在對面板數據進行格蘭傑因果檢驗時,由於被解釋變數(dependentvariable)的滯後項作為解釋變數(explanatory variable)出現在方程右邊,故為動態面板模型(dynamic panel),應使用差分GMM或系統GMM進行估計,詳見陳強(2015,p.381)。
10、從哪裡可以下載《計量經濟學及Stata應用》與《高級計量經濟學及Stata應用》這兩本教材的數據集?
答: 關於我的本科教材《計量經濟學及Stata應用》與研究生教材《高級計量經濟學及Stata應用》,其數據集與課件均可從我的個人網站www.econometrics-stata.com 下載。
陳強老師十一北京『』高級計量經濟學與stata『』現場培訓
提供專用講義,面對面跟陳老師學習
2016年最後一場陳強老師培訓
培訓時間:2016年10月1-4日 (四天)
培訓地點:北京市海淀區首都體育學院
培訓費用:3600元 /3000元 (僅限全日制本科生和碩士研究生)
授課安排:上午9:00-12:00;下午2:00-5:00;答疑5:00-5:30
講師介紹:
陳強,分別於1992年與1995年獲得北京大學經濟學學士與碩士學位,2007年獲美Northern Illinois University數學碩士與經濟學博士學位,現任山東大學經濟學院教授,泰岳經濟研究中心副主任(主持工作)。
主要研究領域為發展經濟學、計量經濟學及經濟史。
已獨立發表論文於Oxford Economic Papers,Economica,Journal of Comparative Economics,《經濟學季刊》、《世界經濟》等國內外期刊。
獨立編著的經典教材《高級計量經濟學及Stata應用》第二版於2014年由高教出版社出版。
2010年入選教育部新世紀優秀人才支持計劃。
培訓目的:
掌握高級計量經濟學的核心方法及Stata操作,不再茫然,知其然而知其所以然,迅速成為處理數據及定量分析的高手。
課程特色:
直觀地解釋高級計量經濟學方法,通過案例學習相應的Stata操作,深入淺出地介紹實證分析與論文寫作的精髓。
課程配套資料:
課程PPT、數據集及相關論文。
基礎要求:
由於學員的基礎不同,本課程僅對學員背景做最低要求,即假設學員知道概率統計及少量線性代數,但不要求學過計量經濟學或Stata操作。因為「大道至簡至易」,初級計量與高級計量的本質是一樣的,學子們最需要的是能夠直指人心地洞明計量原理與操作工具,然後得心應手地用於實戰(而非完成習作)。
課程大綱:
第一講:
著重介紹小樣本與大樣本OLS,以及相應的普通標準誤、異方差穩健標準誤、聚類穩健標準誤、異方差自相關穩健標準誤、自助標準誤等。深切理解OLS的原理與適用條件,是一切計量原理的基礎。
第二講:
及時地介紹Stata知識,以OLS在Stata的實現作為入門,體會Stata的簡單與強大。
第三講:
介紹解決內生性的諸多利器,如工具變數法(2SLS與GMM)、隨機與自然實驗、雙重差分法、傾向得分匹配等。由於雙向因果、遺漏變數、度量誤差的普遍存在,內生性是實證研究的常見難題,這也凸顯了解決內生性在實踐中的重要性。
第四講:
介紹在微觀經濟學(比如企業、家庭)研究中常見的計量方法,包括二值與多值選擇、排序與計數模型、斷尾歸併回歸、樣本選擇模型等。
第五講:
介紹靜態面板,包括固定效應、隨機效應、時間效應等。面板數據由於能控制個體異質性(heterogeneity),緩解遺漏變數偏差,在實踐中越來越重要;而靜態面板則是最常見的面板。
第六講:
介紹動態面板與非線性面板,包括面板工具變數法、差分GMM、系統GMM、面板二值選擇模型、面板計數模型等,其應用也日益廣泛。
第七講:
介紹在宏觀經濟學與金融學中常見的時間序列方法,包括ARMA,ADL,VAR,單位根與協整等。
第八講:
以經典論文為例,介紹實證研究步驟與論文寫作,從如何選題、查找文獻、數據收集,到使用合適的計量方法,編寫Stata程序,到論文寫作、seminar演講、投稿修改等各環節技巧。
獨家秘笈分享:
如何成功申請科研基金
優惠:
現場班老學員9折優惠;
同一單位三人以上同時報名9折優惠;
以上優惠不疊加。
PS:根據繳費順序安排座位
報名流程:
推薦閱讀:
※Day4-《The Introduction of Statistical Learning》學習筆記
※政治科學中的量化文本分析(二):內容分析的發展歷史
※斷點回歸的stata操作
※對P值的批評|Enough,就這幾個理由顛來倒去
※計量經濟學證明常需要用的一些定理