R語言與應用計量經濟學
除了學科本身的差異以外,兩個群體用的工具也存在較大的差異。應用計量經濟學的人較多的是用Stata,統計學的人較多的是用R。
- 事實上的通用工具Stata
Stata的優勢在於提供一站式的軟體包,並且也可以以ado文件的形式進行擴展,自帶的PDF用戶手冊(TeX)非常詳細。作為商業軟體Stata為數據分析結果提供verifiably accurate,其分析結果被FDA認可。數據分析結果高度可信,這個優點得到每一個用戶的喜歡。
當然了缺點也有,不然在應用計量領域中沒有R的事情了。
如擴展豐富度不夠(與R比);
一個窗口只能保留一個數據文件;
數據可視化水平一般
……
所以The 2016 Stata Conference開始考慮Stata與Web的交互能力,甚至考慮用Stata做出D3.js那樣的數據可視化作品。
- 日益豐富的R
R語言的優點在網上有很多。這裡就不多多說了。如可以操作多個數據集和對象、Rstudio提供良好的開發環境、豐富的畫圖包,靜態的ggpot2,互動式的plotly、號稱操作100GB數據的data.table、可以生成動態報告的rmarkdown、量化投資利器quantmod……在大數據的熱潮中,微軟加盟R語言社區,還專門發行了增強版的R語言MRO,並且在自己的產品中嵌入R。
R語言這麼厲害,當然也會被引入到應用計量經濟學中。Kleiber and Zeileis(2008)寫了一份小冊子Applied Econometrics with R,這個算是比較早專門介紹R語言在應用計量經濟學中的使用。因為這本書還有一個專門的R包AER。不過這個AER非彼AER(American Economic Review)。Zeileis and Koenker(2008)在JSS上寫了一篇文章,名字非常帶感Econometrics in R: Past, Present, and Future。這麼多年過去了,當年的Future已經是Present,只是現在這個Present估計還沒有達到他們當年的預期。
R語言社區在CRAN Task View設立一個Econometrics,包的種類挺豐富:Basic linear regression、Microeconometrics、Instrumental variables、Panel data models、Further regression models、Time series data and models、Data sets和Miscellaneous。
面對眼花繚亂的包、風格迥異的操作,沒有老司機帶路,新手不敢上路呀。所以一般的新手紛紛奔向Stata陣營去了。因為圍繞著Stata講應用計量經濟學的教程實在是太多了。
- 經管類小夥伴如何上手R
Muenchen R A, Hilbe J. R for Stata users[M]. New York, New York: Springer, 2010.
一本介紹轉向R的書。
R FOR STATA USERSDictionary: Stata to RGetting Started in R~Stata這個三個材料很棒,簡明,迅速!採用對比的手法,幫助Stata用戶快速上手R。
Kleiber C, Zeileis A. Applied econometrics with R[M]. Springer Science & Business Media, 2008.
比較全面的把R帶入應用計量經濟學。
Farnsworth G V. Econometrics in R[M]. 2014.
70頁的小冊子,快速熟悉各類應用計量模型。
經管類的小夥伴一定對Wooldridge不陌生。如果把Wooldridge的Introductory Econometrics用R實現一遍是什麼樣的感覺?
哈哈,已經有牛人做了。這就是Heiss寫的Using R for Introductory Econometrics。
"A very nice resource for those wanting to use R in their introductory econometrics courses." (Jeffrey M. Wooldridge)
這本書配套2016年版的Introductory Econometrics,而且還介紹了R with R Markdown or LaTeX。想了解Rmarkdown點這裡。
這本書提供了網頁版,可以在線閱讀。當然也可以在網上買實體書。
做資本市場數據的小夥伴手頭上常常玩的是面板數據。R如何處理面板數據?
Croissant Y, Millo G. Panel data econometrics in R: The plm package[J]. Journal of Statistical Software, 2008, 27(2): 1-43.
上面這篇PDF是做面板的一個很好的讀物。它對plm包做了十分細緻的描述,應用的便捷程度不下於Stata的xtreg命令集。
Croissant and Millo(2016)乾脆把2008年在JSS上的文章豐富一下,就整成了一本小冊子。
Croissant Y, Millo G. Panel Data Econometrics with R[M]. Wiley-Blackwell, 2016.
做時間序列(金融數據)的小夥伴可以閱讀下面這本書。
Tsay R S. An introduction to analysis of financial data with R[M].
- 三個建議
IDE,IDE,IDE。盡量採用IDE,提高效率。可以用Rstudio(preview-release)。
優先使用知名的包、一直在更新的包。這個很重要。一個R包排行榜。
- 結束
到這裡基本上已經介紹了R在應用計量經濟學中的主要板塊中的教程,可以放心學習上手R了。
不過……
R的包多是多,但是質量良莠不齊,代碼風格不統一。
有些R包的說明文檔解釋不全,導致用戶對各個參數的使用並不明晰。
The R Core Team特別提醒用戶,「R is free software and comes with ABSOLUTELY NO WARRANTY 」。
前方有坑,小心駕駛……
======================================================================
更新1:
Principles of Econometrics with R,點擊鏈接可以下載。這本書不錯,2016出來的,比較全面展現了R在應用計量中的使用。數據鏈接。
更新2:
Applied Econometrics,採用R語言和Stata雙語教學??
有新材料出現,再補上
推薦閱讀:
※r 如何更新,不需要重裝的手段進行更新?
※如何高效的在R里寫出一個循環?
※輔修計算機的學生該怎麼找計算機相關的工作?
※當下對於量化投資有用的R語言包有哪些?
※ggplot2能做這種圖么?