R能做哪些stata不能做的事?

rt,最近在翻看一本r語言的書,上面大部分都是回歸分析,感覺stata也可以做,而且更加簡潔,那R語言有什麼stata不能做的嗎?


  1. 有了mata語言,理論上R能做的Stata也能做
  2. stata call R,google之,R能做的stata都能做

當然,說句良心話,第一條,stata裡面自己寫估計方法什麼的比R要麻煩多了~第二條就是作弊


謝 @機智孫 邀。

Stata 用的沒 R 熟,所以下面列出的一些功能可能並不是Stata相比於R的劣勢,一家之言,求輕拍。

  1. R比Stata更適合矩陣運算

    這裡不是說Stata矩陣計算能力不行,而是R中的數據管理方式更適合。印象里Stata的矩陣和數據集是不同的,矩陣不能直接像數據集那樣編輯,這就使得矩陣計算的時候比R和Matlab這樣直接數據即矩陣的來的麻煩。

  2. R是更好的腳本語言

    在使用Stata的時候,我大多的使用情境是:讀入數據,開始reg,看結果是否滿意。滿意了導出結果,不滿意接著增減變數或者換方法直到鼓搗出一個滿意的結果。而用R的時候,統計分析常常只是整個腳本里的一部分,比如一次統計分析得到的某個參數再帶入下一環節使用。因為Stata一次只能面對一個數據集進行操作,這使得調用多個數據集的分析要麻煩不少。比如R中,我需要對一個子數據集進行分析的話,我可以先把分析流程寫成一個function,然後再用dplyr或者類似的包subset一個子數據集扔給前述的function,最後得到需要的參數結果,而在Stata中,subset之後面對的只有子數據集了,回到母數據集還要再讀入數據(或許Stata有更方便的實現辦法,但我當時學的時候只會這樣做…)。

  3. R有更多令人excited的包

    比如Shiny包,html小白也可以做互動式應用了;

    比如Slidify包,帶統計分析的pre抬手就有;

    比如謝益輝的knitr包,可重複的分析報告,不必因為某個小小的數據變化就把一切推倒重來了;

    比如quantmod包,可以直接借用各種技術分析指標…

  4. 先想到這麼多,後面想到了再補


Stata 你要學兩個系統的東西。。。這是 Stata 為了做兼容做出的「愚蠢」(可能用詞不當)的犧牲, 然後閉源,被牽著鼻子,你要永遠跟著 Stata 公司走。


我只用stata學過幾門課寫過一篇文章,學的不紮實。要說計量方面,沒多少R能做stata不能做的,當然要非得說的話,大部分東西excel也能做,原理都是一樣的,無非是換個平台。

最大的區別就是,stata點點滑鼠就能上手,學起來快(當然像我這種,忘起來也快),簡潔方便,做計量非常專業。R本質上來說是個編程語言,儘管在碼農眼裡很垃圾,但他能像編程語言一樣寫,這也就是說,它更加萬金油,stata能做的它都能做,哪怕沒有現成可用的R包你也能自己寫。而我沒記錯的話,stata是不能寫函數的吧。

比方說,R可以搞出偽裝stata的圖表;stata怎麼畫ggplot2里的各種圖,我就不會了。

就是打個比方,stata就是賣成衣的,R就是個裁縫鋪,你說能替代嗎,算是能吧。裁縫鋪訂做不能立即就穿上,可成衣有時候袖子短了腰上胖了也沒法改。

當然我覺得選擇用什麼軟體/語言的唯一標準是:你老闆,你師兄,你同事都在用啥,你就跟著用。


我覺得真沒什麼R不能做的…


1,Stata有系統完整的計量統計包,最重要的就是科研需要的嚴謹,寫一個package不光要保證自己的編寫內容正確,還要保證你參考或者編譯的代碼也是經過嚴格測試的,即穩定性要求。

2.Stata的出版物都是嚴格控制以保證出版質量的,也就說它的書籍pdf版本除了掃描版外,幾乎不會有其他來源。

3.Stata Journal屬於SSCI

4.stata怎麼畫ggplot2里的各種圖:(brewscheme命令可以做到的)

5.Stata最大的特色其實是公認的help文件。

6.相比較R,Stata弱在繪圖和一些前沿就是非常難問題的應用上,免費是R不斷得到普及的重要原因之一。


比如在美國幫你找一份數據向的工作。


R,統計學只要有新的方法,各種可使用的包就開發出來了,更新更快,無所不有,關鍵是————————————————————免費!!!!!!!!!!!!

state就更新沒這麼快了——————而且,收錢!

一般國外使用R居多,國內SAS和SPSS居多。


什麼都不用說,關是STATA一個matsize最高只能11000,它在稍微大一點點的數據上就沒法用了。這是硬傷。數據小可以考慮用一下


空間計量:空間回歸,空間面板,寫畢業論文就在用


推薦閱讀:

如果掌握了大數據,能不能預測股市?
中國的大數據中心有哪些?為何新的中國的大數據中心選貴陽?
為什麼蘋果會選擇在貴州建立大數據中心?
沒有集群環境,怎麼學好大數據處理框架(Hadoop,Spark)的相關知識?

TAG:數據分析 | 統計 | R編程語言 | 大數據 |