R語言與應用計量經濟學

雖然計量經濟學和統計學關係密切,但是兩者存在較大的差異性。應用計量經濟學主要是研究經濟變數之間的關係,並且努力證明其為因果關係。這也是為什麼現在在經管類實證研究文獻中基於自然實驗(Natural Experiment)的經驗研究非常流行的原因。

除了學科本身的差異以外,兩個群體用的工具也存在較大的差異。應用計量經濟學的人較多的是用Stata,統計學的人較多的是用R。

  • 事實上的通用工具Stata

Stata的優勢在於提供一站式的軟體包,並且也可以以ado文件的形式進行擴展,自帶的PDF用戶手冊(TeX)非常詳細。作為商業軟體Stata為數據分析結果提供verifiably accurate,其分析結果被FDA認可。數據分析結果高度可信,這個優點得到每一個用戶的喜歡。

當然了缺點也有,不然在應用計量領域中沒有R的事情了。

如擴展豐富度不夠(與R比);

一個窗口只能保留一個數據文件;

數據可視化水平一般

……

所以The 2016 Stata Conference開始考慮Stata與Web的交互能力,甚至考慮用Stata做出D3.js那樣的數據可視化作品。

  • 日益豐富的R

R語言的優點在網上有很多。這裡就不多多說了。如可以操作多個數據集和對象、Rstudio提供良好的開發環境、豐富的畫圖包,靜態的ggpot2,互動式的plotly、號稱操作100GB數據的data.table、可以生成動態報告的rmarkdown、量化投資利器quantmod……在大數據的熱潮中,微軟加盟R語言社區,還專門發行了增強版的R語言MRO,並且在自己的產品中嵌入R。

R語言這麼厲害,當然也會被引入到應用計量經濟學中。Kleiber and Zeileis(2008)寫了一份小冊子Applied Econometrics with R,這個算是比較早專門介紹R語言在應用計量經濟學中的使用。因為這本書還有一個專門的R包AER。不過這個AER非彼AER(American Economic Review)。

Zeileis and Koenker(2008)在JSS上寫了一篇文章,名字非常帶感Econometrics in R: Past, Present, and Future。這麼多年過去了,當年的Future已經是Present,只是現在這個Present估計還沒有達到他們當年的預期。

R語言社區在CRAN Task View設立一個Econometrics,包的種類挺豐富:Basic linear regression、Microeconometrics、Instrumental variables、Panel data models、Further regression models、Time series data and models、Data sets和Miscellaneous。

面對眼花繚亂的包、風格迥異的操作,沒有老司機帶路,新手不敢上路呀。所以一般的新手紛紛奔向Stata陣營去了。因為圍繞著Stata講應用計量經濟學的教程實在是太多了。

  • 經管類小夥伴如何上手R

Muenchen R A, Hilbe J. R for Stata users[M]. New York, New York: Springer, 2010.

一本介紹轉向R的書。

R FOR STATA USERS

Dictionary: Stata to R

Getting Started in R~Stata

這個三個材料很棒,簡明,迅速!採用對比的手法,幫助Stata用戶快速上手R。

Kleiber C, Zeileis A. Applied econometrics with R[M]. Springer Science & Business Media, 2008.

比較全面的把R帶入應用計量經濟學。

Farnsworth G V. Econometrics in R[M]. 2014.

70頁的小冊子,快速熟悉各類應用計量模型。

經管類的小夥伴一定對Wooldridge不陌生。如果把Wooldridge的Introductory Econometrics用R實現一遍是什麼樣的感覺?

哈哈,已經有牛人做了。這就是Heiss寫的Using R for Introductory Econometrics。

"A very nice resource for those wanting to use R in their introductory econometrics courses." (Jeffrey M. Wooldridge)

這本書配套2016年版的Introductory Econometrics,而且還介紹了R with R Markdown or LaTeX。想了解Rmarkdown點這裡。

這本書提供了網頁版,可以在線閱讀。當然也可以在網上買實體書。

做資本市場數據的小夥伴手頭上常常玩的是面板數據。R如何處理面板數據?

Croissant Y, Millo G. Panel data econometrics in R: The plm package[J]. Journal of Statistical Software, 2008, 27(2): 1-43.

上面這篇PDF是做面板的一個很好的讀物。它對plm包做了十分細緻的描述,應用的便捷程度不下於Stata的xtreg命令集。

Croissant and Millo(2016)乾脆把2008年在JSS上的文章豐富一下,就整成了一本小冊子。

Croissant Y, Millo G. Panel Data Econometrics with R[M]. Wiley-Blackwell, 2016.

做時間序列(金融數據)的小夥伴可以閱讀下面這本書。

Tsay R S. An introduction to analysis of financial data with R[M].

  • 三個建議

R發行版可以採用微軟的版本Microsoft R Open,充分利用多核處理器的優勢。

IDE,IDE,IDE。盡量採用IDE,提高效率。可以用Rstudio(preview-release)。

優先使用知名的包、一直在更新的包。這個很重要。一個R包排行榜。

  • 結束

到這裡基本上已經介紹了R在應用計量經濟學中的主要板塊中的教程,可以放心學習上手R了。

不過……

R的包多是多,但是質量良莠不齊,代碼風格不統一。

有些R包的說明文檔解釋不全,導致用戶對各個參數的使用並不明晰。

The R Core Team特別提醒用戶,「R is free software and comes with ABSOLUTELY NO WARRANTY 」。

前方有坑,小心駕駛……

======================================================================

更新1:

Principles of Econometrics with R,點擊鏈接可以下載。這本書不錯,2016出來的,比較全面展現了R在應用計量中的使用。數據鏈接。

更新2:

Applied Econometrics,採用R語言和Stata雙語教學??

有新材料出現,再補上


推薦閱讀:

r 如何更新,不需要重裝的手段進行更新?
如何高效的在R里寫出一個循環?
輔修計算機的學生該怎麼找計算機相關的工作?
當下對於量化投資有用的R語言包有哪些?
ggplot2能做這種圖么?

TAG:计量经济学 | R编程语言 | Stata |