標籤:

R 語言必學的 10 大包是什麼?

R語言優秀的包有很多,如果排出必學的前十名應該是什麼呢,比如plyr、ggplot2還有什麼呢


Let us explore the list based on the number of downloads!

  1. Rcpp Seamless R and C++ Integration (693288 downloads, 3.2/5 by 10 users)

  2. ggplot2 An Implementation of the Grammar of Graphics (598484 downloads, 4.0/5 by 82 users)
  3. stringr Simple, Consistent Wrappers for Common String Operations.(543434 downloads, 4.1/5 by 18 users)
  4. plyr Tools for Splitting, Applying and Combining Data(523220 downloads, 3.8/5 by 65 users)
  5. digest Create Cryptographic Hash Digests of R Objects. (521344 downloads)
  6. reshape2 Flexibly Reshape Data: A Reboot of the Reshape Package (483065 downloads, 4.1/5 by 18 users)
  7. colorspace Color Space Manipulation (476304 downloads, 4.0/5 by 2 users)
  8. RColorBrewer ColorBrewer Palettes(453858 downloads, 4.0/5 by 17 users)
  9. manipulate Interactive Plots for RStudio. (395232 downloads)
  10. scales Scale Functions for Visualization(394389 downloads)
  11. labeling Axis Labeling (373374 downloads )
  12. proto Prototype object-based programming. (369096 downloads)
  13. munsell Munsell colour system. (368949 downloads)
  14. gtable Arrange grobs in tables (364015 downloads)
  15. dichromat Color Schemes for Dichromats (362562 downloads)
  16. mime Map Filenames to MIME Types.(352780 downloads)
  17. RCurl General network (HTTP/FTP/...) client interface for R.(340530 downloads, 4.2/5 by 11 users)
  18. bitops Bitwise Operations(322743 downloads)
  19. zoo S3 Infrastructure for Regular and Irregular Time Series (Z"s Ordered Observations) (302052 downloads, 3.8/5 by 11 users)
  20. knitr A General-Purpose Package for Dynamic Report Generation in R. (295528 downloads)

最後,歡迎大家關注我的專欄:R語言與數據挖掘 - 知乎專欄


10 R packages I wish I knew about earlier

http://blog.yhathq.com/posts/10-R-packages-I-wish-I-knew-about-earlier.html


Search all R packages and function manuals

這個網站可以用來搜索所有的R包和函數,還有貼心的下載排行。。。

絕對對口問者的問題。。。下載量是個很強的指標。。。


待完善。

1.dplyr

2.reshape2

3.ggplot2

4.shiny

5.caret

6.forecast


排名不分先後

  1. dplyr

  2. reshape2

  3. ggplot2

  4. knitr

  5. formatR

  6. shiny

  7. Hmisc

  8. car

  9. survival

  10. foreign


有高手用類似 Page Rank 的方法搞了個R package 的排名,前20名如下:

1 stats 10.0


2 methods 9.2208


3 utils 8.9407


4 MASS 8.8069


5 graphics 8.6897

6 lattice 8.2479


7 survival 7.6583


8 grDevices 7.5612


9 mvtnorm 6.9506


10 tcltk 6.8526


11 nlme 6.6053


12 grid 6.5991


13 splines 6.4603


14 Matrix 6.2502


15 maps 6.2338

16 mapproj 5.8464


17 boot 5.6763


18 rJava 5.6149


19 nnet 5.612


20 rgl 5.582

具體內容見該大神博客 Package Rank v1.1發布,及兵器譜分析


qinwf/awesome-R · GitHub 兩位大神整理的優秀R包集合,分門別類很好用的!


我用R主要是簡單的統計分析,解一些微分方程並且畫圖,用的比較多的軟體包是:

1. ggplot2,這個應該不用多說了吧,基本上所有的畫圖都可以完成,代碼簡潔優美,畫圖質量為出版級的,而且和gridExtra搭配可以將多張圖輸出到一頁上面。目前個人感覺唯一不方便的是當需要將一幅圖輸出到多頁的時候,需要自己寫一些循環的語句實現。

2. dplyr,同樣也是Hadley大神的作品,在原來plyr的基礎上實現了速度的升級以及代碼的簡化直接。當然在處理較小數據集的時候兩個數據集差別不大,但是當文件大小在幾百兆到上G的時候,dplyr的速度優勢就非常明顯了。

3. stringr,處理字元串的神器。

4. deSolve,用於解微分方程的,做一些簡單的數學模擬非常有用,而FME這個package可以用於微分方程的參數估計(但是不如其他更加專門的軟體包運行速度快)。

5. reshape2,對數據進行整理。


data.table


除了上述那些應用型的包外

並行 內存管理 嵌入C語言 再或者spark

R處理大數據感覺缺陷比較大,先夯實好地基,要不然真心沒法用啊!


其實我覺得是看你的專業了。。。我用的最多的還有parallelSVM估計大家都沒聽過


推薦閱讀:

R有將中文地址轉化成經緯度的包么?
怎麼用R語言繪製英文中國地圖,標註英文省名,以及在不同的省份填充指定的顏色?
做黑客需要會多少種語言?
如何高效的在R里寫出一個循環?
如何用R語言匹配兩個表的數據?

TAG:R編程語言 |