【翻譯】Awesome R資源大全中文版來了,全球最火的R工具包一網打盡,超過300+工具,還在等什麼?

0.前言

  雖然很早就知道R被微軟收購,也很早知道R在統計分析處理方面很強大,開始一直沒有行動過。。。直到

  直到12月初在微軟技術大會,看到我軟的工程師演示R的使用,我就震驚了,然後最近在網上到處了解和爬一些R的資料,看著看著就入迷了,這就是個大寶庫了,以前怎麼沒發現,看來還是太狹隘了。直到前幾天我看到這個Awesome R文檔,我就靜不下來了,對比了目前自己的工作和以後的方向,非常適合我。所以毫不猶豫的把這個文檔漢化了,所以大家一起享受吧。

說明:本文已經提交到github,地址:asxinyu/awesome-R ,由於個人知識和能力限制,部分組件特別是機器學習方面比較專業的術語無法翻譯,如果有懂的朋友可以留言或者在github直接修改。一起完善。

這裡有很多非常不錯的R包和工具. 該想法來自於awesome-machine-learning.

這裡是包的導航清單,看起來更方便 Awesome R - Find Great R Packages

  通過這些翻譯了解這些工具包,以後幹活也就方便多了。不過翻譯這個東西的確要靠耐心,翻譯,編輯花費了至少一周的空餘時間。  

  在編輯本文的過程中,驚喜的發現原來 伯樂在線 也在翻譯Awesome系列的其他資源:地址在github:

1.jobbole/awesome-dotnet-cn

2.jobbole/awesome-java-cnJava資源大全中文版(Awesome最新版) - 張果 - 博客園

3.https://github.com/jobbole/awesome-javascript-cn

JavaScript資源大全中文版(Awesome最新版) - 張果 - 博客園

1.集成開發環境

  • RStudio - 一個非常強大高效的圖形界面開發環境,可以在Windows, Mac, 和Linux運行. 官網:Home
  • Emacs + ESS - ESS是一個emacs文本編輯器的一個統計分析的插件. 官網:Emacs Speaks Statistics
  • Sublime Text + R-Box - 一個在Sublime 2/3中使用R語言編程的插件. 官網:randy3k/R-Box
  • TextMate + r.tmblundle - TextMate 1/2的插件. 官網:textmate/r.tmbundle
  • StatET - 一個基於Eclipse的R語言IDE. 官網:WalWare - Homepage
  • Revolution R Enterprise - 專註於大數據,大規模多處理器的功能,可以對學術用戶免費提供和商業使用. 官網:R Server Overview-R Data Analysis
  • R Commander - 一個包括基本圖形用戶界面的R包. 官網:R Commander
  • IRkernel - Jupyter的R語言內核. 官網:IRkernel/IRkernel
  • Deducer - 一個菜單驅動的數據分析的GUI工具,類似電子表格數據編輯器. 官網:Deducer: A GUI for R
  • Radiant - 一個使用R語言,獨立的基於瀏覽器介面的業務分析平台,基於Shiny. 官網:Radiant - Business analytics using R and Shiny
  • Vim-R - Vim中R語言插件. 官網:vim-scripts/Vim-R-plugin
  • Nvim-R - Neovim中R語言插件. 官網:jalvesaq/Nvim-R
  • JASP - 一個完整的貝葉斯和概念論相關方法的R包,和使用SPSS非常相似。 官網:A Fresh Way to Do Statistics
  • Bio7 - 一個包括創建,科學圖像分析和統計分析的IDE. 官網:bio7.org/
  • RTVS - Visual Studio中R開發工具. 官網:Welcome to R Tools for Visual Studio Preview!

2.語法

  • magrittr - 一個R語言高效的管道操作包. 官網:tidyverse/magrittr
  • pipeR - 多泛型管道的實現. 官網:renkun-ken/pipeR
  • lambda.r - R語言中函數式編程和簡單的模式匹配. 官網:zatonovo/lambda.r
  • purrr - 一個高級函數編程語言包. 官網:hadley/purrr

3.數據操作

  • dplyr - 快速數據操作和資料庫查詢. 官網:hadley/dplyr
  • data.table - 使用短小靈活的語法操作數據. 官網:Rdatatable/data.table
  • reshape2 - 靈活的數據排列,聚合處理. 官網:hadley/reshape
  • readr - 一個快速簡單的讀取表格數據到R中的包. 官網:tidyverse/readr
  • haven - 對導入SPSS,STATA和SAS的文件進行改進. 官網:tidyverse/haven
  • tidyr - 方便對數據進行整理、傳播和收集. 官網:tidyverse/tidyr
  • broom - 將統計分析對象轉換成整齊的數據框(一種數據組織和呈現的方式). 官網:tidyverse/broom
  • rlist - 一個操作非規範化數據的工具箱. 官網:renkun-ken/rlist
  • jsonlite - 一個快速解析JSON文件的包. 官網:jeroenooms/jsonlite
  • ff - 設計用來存儲大型數據集的數據結構. 官網:ff
  • lubridate - 一組日期和時間函數. 官網:CRAN - Package lubridate
  • stringi - 基於ICU的字元串處理方案. 官網:stringi: THE string processing package for R
  • stringr - 基於stringi之上的對字元串處理API. 官網:tidyverse/stringr
  • bigmemory - 提供共享內存和內存映射矩陣,同時也包提供額外的工具,包括線性模型.(biglm) 和隨機森林 (bigrf). 官網:CRAN - Package bigmemory
  • fuzzyjoin - 使用不精確匹配的方式連接表數據. 官網:dgrtwo/fuzzyjoin
  • tidyverse - 簡單從tidyverse下載和安裝包. 官網:tidyverse/tidyverse

4.圖形顯示

  • ggplot2 - 強大的繪圖統計和計算圖形系統的實現.強烈推薦. 官網:tidyverse/ggplot2
  • ggfortify -一個ggplot2(流行的統計軟體包)統一的介面(使用一行代碼即可). 官網:sinhrks/ggfortify
  • ggrepel - 排除重疊的文本標籤. 官網:slowkow/ggrepel
  • ggalt - ggplot2額外的坐標系統,幾何和統計. 官網:hrbrmstr/ggalt
  • ggtree - 可視化和注釋的系統樹. 官網:GuangchuangYu/ggtree
  • ggplot2 Extensions - ggplot2擴展顯示例子. 官網:ggplot2 extensions
  • lattice - 一個強大優雅的高級數據可視化系統. 官網:trellis graphics for R
  • corrplot - 圖形顯示相關矩陣或一般矩陣。它還包含一些矩陣重新排序演算法. 官網:taiyun/corrplot
  • rgl - R中3D可視化系統. 官網:CRAN - Package rgl
  • Cairo - 一個使用cairo組件創建高質量顯示輸出的R圖形包. 官網:CRAN - Package Cairo
  • extrafont - 在R中圖像中使用字體的工具. 官網:wch/extrafont
  • showtext - 讓R圖形設備顯示文本的時候使用系統字體. 官網:yixuan/showtext
  • animation - 一個使用 ImageMagick在R中產生動畫圖形的工具. 官網:animation by yihui
  • gganimate - 用ggplot2創建簡單的動畫. 官網:dgrtwo/gganimate
  • misc3d - 強大的3D繪圖工具. 官網:CRAN - Package misc3d
  • xkcd - 在圖表中使用xkcd風格. 官網:CRAN - Package xkcd
  • imager - 一個基於CImg庫的圖像處理包. 官網:dahtah.github.io/imager

5.HTML部件

  • d3heatmap - 使用D3繪製互動的熱圖. 官網:rstudio/d3heatmap
  • DataTables - 將R矩陣或數據框作為交互的HTML表. 官網:DT: An R interface to the DataTables library
  • DiagrammeR - 在R中創建JS圖表和流程圖. 官網:rich-iannone/DiagrammeR
  • dygraphs - 在R中繪製時間序列數據圖形. 官網:rstudio/dygraphs
  • formattable - 可格式化的數據結構. 官網:formattable by renkun-ken
  • ggvis - R中互動式的圖形處理語法. 官網:rstudio/ggvis
  • Leaflet - 一個非常流行的互動式地圖JavaScript組件. 官網:Leaflet for R - Introduction
  • MetricsGraphics - 可以輕鬆創建D3散點圖、折線圖和直方圖. 官網:hrbrmstr.github.io/metr
  • networkD3 - D3 JavaScriptR網路圖. 官網:christophergandrud.github.io
  • scatterD3 - D3 互動散點圖. 官網:juba/scatterD3
  • plotly - 使用plot.ly進行互動式ggplot2和Shiny繪圖. 官網:ropensci/plotly
  • rCharts - 互動式JS繪圖. 官網:ramnathv/rCharts
  • rbokeh - Bokeh的R介面. 官網:rbokeh
  • threejs - 互動式3D散點圖和地球儀. 官網:bwlewis/rthreejs
  • timevis - 創建完全互動式的時間軸可視化圖形. 官網:daattali/timevis
  • visNetwork - 使用vis.js類庫進行網路可視化. 官網:datastorm-open/visNetwork

6.復用組件研究

  • knitr - R中簡單的動態報表生成工具. 官網:knitr: Elegant, flexible and fast dynamic report generation with R
  • xtable - 將表格導出到LaTeX或者HTML. 官網:CRAN - Package xtable
  • rapport - 一個R模版系統. 官網:rapport: an R templating system
  • rmarkdown - R動態文檔工具. 官網:R Markdown
  • slidify - 創建和發布漂亮的html5展示效果. 官網:ramnathv/slidify
  • Sweave - 使用R創建LaTeX報表的R包. 官網:LMU - Prof. Friedrich Leisch
  • texreg - 在LaTex和HTML中格式化統計模型. 官網:texreg: Conversion of Statistical Model Output in R to LaTeX and HTML Tables
  • checkpoint - 從檢查點快照伺服器安裝包. 官網:RevolutionAnalytics/checkpoint
  • brew - 報告模板的生成框架.可以和knitr合併. 官網:CRAN - Package brew
  • ReporteRs - 一個生成微軟Word, PowerPoint和HTML報表的R包. 官網:Microsoft Word and PowerPoint Documents Generation ? ReporteRs package
  • bookdown - 使用R Markdown編寫書籍. 官網:bookdown: Easy Book Publishing with R Markdown
  • ezknitr - 避免使用"knitr"帶來的工作目錄的痛苦. 官網:ropensci/ezknitr

7.Web技術和服務

  • Web Technologies List - 關於如何使用R和網路的相關信息. 官網:ropensci/webservices
  • shiny - 使用R創建簡單的Web交互應用. 官網:rstudio/shiny
  • RCurl - 常規的網路客戶端介面 (HTTP/FTP/...) . 官網:CRAN - Package RCurl
  • httr - 使用更加友好的RCurl封裝. 官網:hadley/httr
  • httpuv - HTTP和WebSocket服務程序. 官網:rstudio/httpuv
  • XML - R中生成和解析XML的工具. 官網:CRAN - Package XML
  • rvest - 簡單的web信息抓取,使用CSSSelect 和 XPath 語法. 官網:hadley/rvest
  • OpenCPU - HTTP API. 官網:Producing and Reproducing Results
  • Rfacebook - Facebook API. 官網:pablobarbera/Rfacebook
  • RSiteCatalyst - Adobe 分析服務的R語言客戶端. 官網:randyzwitch/RSiteCatalyst
  • plumber - 一個將現有的R代碼轉換為API的包. 官網:trestletech/plumber

8.並行計算

  • parallel - R語言高性能的並行計算平台. multicore and snow. 官網:CRAN Task View: High-Performance and Parallel Computing with R
  • Rmpi - Rmpi對MPI APIS提供了一個包裝過的介面,它也提供一個互動式的R環境. 官網:CRAN - Package Rmpi
  • foreach - 使用並行來執行循環. 官網:CRAN - Package foreach
  • SparkR - R for Spark. 官網:amplab-extras/SparkR-pkg
  • DistributedR - 一個來自惠普Vertica Analytics團隊的可伸縮的高性能平台. 官網:vertica/DistributedR
  • ddR - 提供分散式數據結構,簡化了R中的分散式計算. 官網:vertica/ddR
  • sparklyr - 來自RStudio的Spark介面. 官網:spark.rstudio.com/

9.高性能

  • Rcpp - Rcpp在R中提供了一個高效的API,使得函數更快執行. 官網:Seamless R and C++ Integration
  • Rcpp11 - Rcpp11完全重新設計,以C++11為目標. 官網:Rcpp11/Rcpp11
  • compiler - 使用JIT提高R代碼的速度. 官網:spark.rstudio.com/

10.語言API

  • rJava - R語言對JAVE介面. 官網:CRAN - Package rJava
  • jvmr - 集成了R, Java, and Scala. 官網:cran/jvmr
  • rJython - R語言對Python/Jython的介面. 官網:CRAN - Package rJython
  • rPython - 允許R調用Python. 官網:CRAN - Package rPython
  • runr - 在R中運行Julia和Bash. 官網:yihui/runr
  • RJulia - R中調用Julia. 官網:armgong/rjulia
  • RinRuby - 一個Ruby庫,整合了R用Ruby解釋器. 官網:sites.google.com/a/ddah
  • R.matlab - 讀寫mat文件,將R和Matlab連接到一起. 官網:CRAN - Package R.matlab
  • RcppOctave -Octave and Matlab的介面. 官網:renozao/RcppOctave
  • RSPerl - 雙向介面,R中調用Perl和在Perl中調用R. 官網:omegahat.org/RSPerl/
  • V8 - 嵌入JavaScript引擎. 官網:jeroenooms/V8
  • htmlwidgets - R中把JavaScript數據可視化的最好方法. 官網:htmlwidgets for R
  • rpy2 - Python對R的介面. 官網:rpy.sourceforge.net/

11.資料庫管理

  • RODBC - R中ODBC資料庫範圍. 官網:CRAN - Package RODBC
  • DBI - 在R和資料庫管理系統之間定義一個公共的介面. 官網:rstats-db/DBI
  • elastic - Elasticsearch HTTP API的包裝器. 官網:ropensci/elastic
  • mongolite - R中Mongo客戶端. 官網:jeroenooms/mongolite
  • RMySQL - R語言的MySQL資料庫介面. 官網:CRAN - Package RMySQL
  • ROracle - R中Oracle資料庫的介面. 官網:CRAN - Package ROracle
  • RPostgreSQL - R語言的PostgreSQL資料庫系統介面. 官網:code.google.com/p/rpost
  • RSQLite - R語言SQLite資料庫介面. 官網:CRAN - Package RSQLite
  • RJDBC - 通過JDBC介面訪問資料庫. 官網:cran.r-project.org/web/
  • rmongodb - R中MongoDB驅動. 官網:dselivanov/rmongodb
  • rredis - R中Redis驅動. 官網:CRAN - Package rredis
  • RCassandra -Apache Cassanda直接介面(不是JAVA),提供了最多的基本功能. 官網:CRAN - Package RCassandra
  • RHive - 通過Apache Hive的R擴展促進分散式計算. 官網:nexr/RHive
  • RNeo4j - Neo4j圖形資料庫驅動. 官網:nicolewhite/RNeo4j

12.機器學習

  • AnomalyDetection - 來自Twitter的AnomalyDetection R包. 官網:twitter/AnomalyDetection
  • ahaz - 半參數添加風險回歸的正則化. 官網:CRAN - Package ahaz
  • arules - 挖掘關聯規則和頻繁項集. 官網:CRAN - Package arules
  • bigrf - 大隨機森林:大型數據集的分類和回歸森林. 官網:CRAN - Package bigrf
  • bigRR - 廣義回歸(特殊是在p >> n情況下). 官網:CRAN - Package bigRR
  • bmrm - 風險最小化方案的正規化方法. 官網:CRAN - Package bmrm
  • Boruta - 所有相關的特徵選擇演算法的一個封裝 . 官網:CRAN - Package Boruta
  • BreakoutDetection - Breakout Detection via Robust E-Statistics from Twitter.[暫時不明真相] 官網:twitter/BreakoutDetection
  • bst - 梯度增加. 官網:CRAN - Package bst
  • CausalImpact - 利用貝葉斯時間序列結構模型進行因果推斷. 官網:google/CausalImpact
  • C50 - C5.0決策樹和基於規則的模型. 官網:CRAN - Package C50
  • caret - 分類和回歸訓練. 官網:CRAN - Package caret
  • Clever Algorithms For Machine Learning
  • CORElearn - 分類、回歸、特徵評價和排序. 官網:CRAN - Package CORElearn
  • CoxBoost - Cox models by likelihood based boosting for a single survival endpoint or competing risks. 官網:CRAN - Package CoxBoost
  • Cubist - 規則和基於實例的回歸建模. 官網:CRAN - Package Cubist
  • e1071 - Misc統計函數 (e1071),主要功能有類別分析、傅里葉變換,模糊聚類,支持向量機,最短路徑計算,樸素貝葉斯分類器等等. 官網:CRAN - Package e1071
  • earth - 多元自適應回歸模型. 官網:CRAN - Package earth
  • elasticnet - 稀疏估計和稀疏主成分分析. 官網:CRAN - Package elasticnet
  • ElemStatLearn - 書籍"The Elements of Statistical Learning, Data Mining, Inference, and Prediction"中的數據集,函數和例子. 官網:CRAN - Package ElemStatLearn
  • evtree - 全局最優樹的進化學習. 官網:CRAN - Package evtree
  • forecast - 使用ARIMA, ETS, STLM, TBATS,和神經網路進行時間序列預測. 官網:CRAN - Package forecast
  • forecastHybrid - 使用"forecast"包對ARIMA, ETS, STLM, TBATS,和神經網路模型進行交叉檢驗. 官網:CRAN - Package forecastHybrid
  • FSelector - 一個基於subset-search或特性排名方法的特徵選擇框架. 官網:CRAN - Package FSelector
  • frbs - 使用模糊規則系統處理分類和回歸的任務. 官網:CRAN - Package frbs
  • GAMBoost -  基於廣義線性和加法模型. 官網:CRAN - Package GAMBoost
  • gamboostLSS - GAMLSS方法的改善. 官網:CRAN - Package gamboostLSS
  • gbm - 改善廣義線性模型. 官網:CRAN - Package gbm
  • glmnet - Lasso 和 elastic-net正規化廣義線性模型. 官網:CRAN - Package glmnet
  • glmpath - L1 Regularization Path for Generalized Linear Models and Cox Proportional Hazards Model. 官網:CRAN - Package glmpath
  • GMMBoost - 廣義混合模型. 官網:CRAN - Package GMMBoost
  • grplasso - Fitting user specified models with Group Lasso penalty. 官網:CRAN - Package grplasso
  • grpreg - Regularization paths for regression models with grouped covariates. 官網:CRAN - Package grpreg
  • h2o - Deeplearning, Random forests, GBM, KMeans, PCA, GLM. 官網:CRAN - Package h2o
  • hda - 異方差判別分析. 官網:CRAN - Package hda
  • ipred - 預測器改進. 官網:CRAN - Package ipred
  • kernlab - kernlab: 基於內核學習的機器實驗室. 官網:CRAN - Package kernlab
  • klaR - 分類和可視化. 官網:CRAN - Package klaR
  • kohonen - 監督和非監督自組織映射. 官網:CRAN - Package kohonen
  • lars - Least Angle Regression, Lasso and Forward Stagewise. 官網:CRAN - Package lars
  • lasso2 - L1 constrained estimation aka 『lasso』. 官網:CRAN - Package lasso2
  • LiblineaR - 基於C/C++庫的線性預測模型. 官網:CRAN - Package LiblineaR
  • lme4 - Mixed-effects models. 官網:lme4/lme4
  • LogicReg - 邏輯回歸模型. 官網:CRAN - Package LogicReg
  • maptree - 映射、修剪和圖形樹模型. 官網:CRAN - Package maptree
  • mboost - Model-Based Boosting. 官網:CRAN - Package mboost
  • Machine Learning For Hackers
  • mvpart - Multivariate partitioning. 官網:CRAN - Package mvpart
  • MXNet - MXNet brings flexible and efficient GPU computing and state-of-art deep learning to R. 官網:dmlc/mxnet
  • ncvreg - Regularization paths for SCAD- and MCP-penalized regression models. 官網:CRAN - Package ncvreg
  • nnet - eed-forward Neural Networks and Multinomial Log-Linear Models. 官網:CRAN - Package nnet
  • oblique.tree - Oblique Trees for Classification Data. 官網:CRAN - Package oblique.tree
  • pamr - Pam: 小矩陣預測分析. 官網:CRAN - Package pamr
  • party - A Laboratory for Recursive Partytioning. 官網:CRAN - Package party
  • partykit - A Toolkit for Recursive Partytioning. 官網:CRAN - Package partykit
  • penalized - L1 (lasso and fused lasso) and L2 (ridge) penalized estimation in GLMs and in the Cox model. 官網:CRAN - Package penalized
  • penalizedLDA - Penalized classification using Fisher"s linear discriminant. 官網:CRAN - Package penalizedLDA
  • penalizedSVM - 使用懲罰函數的特徵選擇支持向量機. 官網:CRAN - Package penalizedSVM
  • quantregForest - quantregForest: Quantile Regression Forests. 官網:CRAN - Package quantregForest
  • randomForest - 隨機森林: Breiman and Cutler"s random forests for classification and regression. 官網:CRAN - Package randomForest
  • randomForestSRC - randomForestSRC: Random Forests for Survival, Regression and Classification (RF-SRC). 官網:CRAN - Package randomForestSRC
  • rattle - 圖形界面式的數據挖掘工具. 官網:CRAN - Package rattle
  • rda - Shrunken Centroids Regularized Discriminant Analysis. 官網:CRAN - Package rda
  • rdetools - Relevant Dimension Estimation (RDE) in Feature Spaces. 官網:CRAN - Package rdetools
  • REEMtree - Regression Trees with Random Effects for Longitudinal (Panel) Data. 官網:CRAN - Package REEMtree
  • relaxo - Relaxed Lasso. 官網:CRAN - Package relaxo
  • rgenoud - R version of GENetic Optimization Using Derivatives. 官網:CRAN - Package rgenoud
  • rgp - R基因編程框架. 官網:CRAN - Package rgp
  • Rmalschains - 使用本地文化基因演算法進行連續問題優化.[這裡翻譯不準]. Search Chains (MA-LS-Chains) in R. 官網:CRAN - Package Rmalschains
  • rminer - 在分類和回歸問題中簡單的使用數據挖掘方法(如神經網路和支持向量機). 官網:CRAN - Package rminer
  • ROCR - 可視化評分分類器的性能. 官網:CRAN - Package ROCR
  • RoughSets - 使用粗糙集和模糊粗糙集理論進行數據分析. 官網:CRAN - Package RoughSets
  • rpart - Recursive Partitioning and Regression Trees. 官網:CRAN - Package rpart
  • RPMM - Recursively Partitioned Mixture Model. 官網:CRAN - Package RPMM
  • RSNNS - Neural Networks in R using the Stuttgart Neural Network Simulator (SNNS). 官網:CRAN - Package RSNNS
  • Rsomoclu - Parallel implementation of self-organizing maps. 官網:CRAN - Package Rsomoclu
  • RWeka - Weka的R介面(Weka是基於JAVA環境下開源的機器學習以及數據挖掘軟體). 官網:CRAN - Package RWeka
  • RXshrink - RXshrink: Maximum Likelihood Shrinkage via Generalized Ridge or Least Angle Regression. 官網:CRAN - Package RXshrink
  • sda - Shrinkage Discriminant Analysis and CAT Score Variable Selection. 官網:CRAN - Package sda
  • SDDA - Stepwise Diagonal Discriminant Analysis. 官網:CRAN - Package SDDA
  • SuperLearner and subsemble - Multi-algorithm ensemble learning packages. 官網:ecpolley/SuperLearner
  • svmpath - svmpath: the SVM Path algorithm. 官網:CRAN - Package svmpath
  • tgp - Bayesian treed Gaussian process models. 官網:CRAN - Package tgp
  • tree - 分類和回歸樹. 官網:CRAN - Package tree
  • varSelRF - 使用隨機森林進行變數選擇. 官網:CRAN - Package varSelRF
  • xgboost - eXtreme Gradient Boosting Tree model, well known for its speed and performance. 官網:tqchen/xgboost

13.自然語言處理

  • text2vec - 一個快速文本挖掘框架。 Fast Text Mining Framework for Vectorization and Word Embeddings. 官網:dselivanov/text2vec
  • tm - 一個全面的文本挖掘框架. 官網:CRAN - Package tm
  • openNLP - Apache OpenNLP工具介面. 官網:CRAN - Package openNLP
  • koRpus - 一個文本分析的R包. 官網:CRAN - Package koRpus
  • zipfR - 詞頻分布統計模型. 官網:CRAN - Package zipfR
  • NLP - 基本自然語言處理功能. 官網:CRAN - Package NLP
  • LDAvis - 主題模型的互動式可視化. 官網:cpsievert/LDAvis
  • topicmodels - Topic modeling interface to the C code developed by by David M. Blei for Topic Modeling (Latent Dirichlet Allocation (LDA), and Correlated Topics Models (CTM)). 官網:CRAN - Package topicmodels
  • syuzhet - Extracts sentiment from text using three different sentiment dictionaries. 官網:CRAN - Package syuzhet
  • SnowballC - Snowball stemmers based on the C libstemmer UTF-8 library. 官網:CRAN - Package SnowballC
  • quanteda - 文本數據的定量分析. 官網:kbenoit/quanteda
  • Topic Models Resources - 主題模型的學習和R相關資源. 官網:trinker/topicmodels_learning
  • NLP for - NLP related resources in R. @Chinese. 官網:BZRLC/R-notes

14.貝葉斯

  • coda - 輸出MCMC(馬爾可夫鏈蒙特卡爾理論)的分析和診斷信息. 官網:CRAN - Package coda
  • mcmc - 馬爾可夫鏈蒙特卡爾理論(MCMC). 官網:CRAN - Package mcmc
  • MCMCpack - 馬爾可夫鏈蒙特卡爾理論 (MCMC). 官網:MCMCpack
  • R2WinBUGS - 在在R/S-PLUS中打開WinBUGS 和 OpenBUGS. 官網:CRAN - Package R2WinBUGS
  • BRugs - OpenBUGS MCMC 軟體的R介面. 官網:CRAN - Package BRugs
  • rjags - JAGS MCMC組件的R介面. 官網:CRAN - Package rjags
  • rstan - Stan MCMC軟體的R介面. 官網:RStan

15.最優化

  • minqa - Derivative-free optimization algorithms by quadratic approximation. 官網:CRAN - Package minqa
  • nloptr - 一個免費開源的非線性最優化程序包. 官網:CRAN - Package nloptr
  • lpSolve - Lp_solve解決線性和整形問題的R介面. 官網:CRAN - Package lpSolve

16.金融

  • quantmod - 定量金融模型和交易框架. 官網:Quantitative Financial Modelling Framework
  • TTR - 技術交易規相關的數據和功能函數. 官網:CRAN - Package TTR
  • PerformanceAnalytics - 計量經濟學性能和風險分析工具. 官網:CRAN - Package PerformanceAnalytics
  • zoo - S3 Infrastructure for Regular and Irregular Time Series. 官網:CRAN - Package zoo
  • xts - 可擴展的時間序列. 官網:CRAN - Package xts
  • tseries - 金融時間序列分析和計算. 官網:CRAN - Package tseries
  • fAssets - 金融資產分析和建模. 官網:CRAN - Package fAssets

17.生物信息學

  • Bioconductor - 用於分析和理解高通量基因組數據的工具. 官網:Bioconductor - Home
  • genetics - 處理基因數據的R包. 官網:CRAN - Package genetics
  • gap - 一個人口家庭遺傳數據分析的綜合工具. 官網:CRAN - Package gap
  • ape - 分子系統學和進化分析. 官網:CRAN - Package ape
  • pheatmap - 一個使用簡單的熱圖工具. 官網:CRAN - Package pheatmap
  • ddpcr - Analysis and visualization of Droplet Digital PCR data. 官網:daattali/ddpcr

18.網路分析

  • Network Analysis List - 網路分析相關資源. 官網:briatte/awesome-network-analysis
  • igraph - 一個網路分析工具集合. 官網:igraph R package
  • network - 一個操作數據關係的基本工具. 官網:CRAN - Package network
  • sna - 基本的網路測量和可視化工具. 官網:CRAN - Package sna
  • netdiffuseR - 網路擴散的分析工具. 官網:USCCANA/netdiffuseR
  • networkDynamic - 支持動態和時序網路. 官網:CRAN - Package networkDynamic
  • ndtv - 構建動畫的可視化動態網路工具,支持多種數據格式. 官網:CRAN - Package ndtv
  • statnet - 大量網路數據的分析,模擬和可視化工具. 官網:Statnet
  • ergm - 指數隨機圖模型. 官網:CRAN - Package ergm
  • latentnet - Latent position and cluster models for network objects. 官網:CRAN - Package latentnet
  • tnet - Network measures for weighted, two-mode and longitudinal networks. 官網:CRAN - Package tnet
  • rgexf - 從R導出網路對象到GEXF, for manipulation with network software like Gephi or Sigma. 官網:gvegayon / rgexf / wiki / Home
  • visNetwork - 使用vis.js類庫進行網路可視化. 官網:datastorm-open/visNetwork

19.R 開發

  • Package Development List - 提高整體開發能力的包. 官網:ropensci/PackageDevelopment
  • devtools - 然R開發人員的生活變得更簡單的工具. 官網:hadley/devtools
  • testthat - 一個R包測試工具. 官網:hadley/testthat
  • R6 - simpler, faster, lighter-weight alternative to R"s built-in classes. 官網:wch/R6
  • pryr - Make it easier to understand what"s going on in R. 官網:hadley/pryr
  • roxygen - 在函數定義中描述說明. 官網:klutometis/roxygen
  • lineprof - R中在線分析結果可視化. 官網:hadley/lineprof
  • packrat - 讓R項目更加簡單,便攜和可重構的工具. 官網:rstudio/packrat
  • installr - R中按照軟體的相關函數(Windows平台). 官網:talgalili/installr
  • import - R的導入機制. 官網:smbache/import
  • modules - 另外一個R模塊系統(Python風格). 官網:klmr/modules
  • Rocker - R configurations for Docker. 官網:rocker-org
  • RStudio Addins - RStudio插件列表. 官網:daattali/addinslist
  • drat - Creation and use of R repositories on 使用R在GitHub或其他平台創建和使用倉儲. 官網:eddelbuettel/drat
  • covr - Test coverage for your R package and (optionally) upload the results to coveralls or codecov. 官網:jimhester/covr
  • lintr - R靜態代碼分析. 官網:jimhester/lintr
  • staticdocs - 為一個R包生成靜態html文檔. 官網:hadley/pkgdown

20.日誌

  • futile.logger - R中類似log4j的日誌記錄包. 官網:zatonovo/futile.logger
  • log4r - R中的log4j介面. 官網:johnmyleswhite/log4r
  • logging - 一個在R中實現log4j的日誌處理包. 官網:CRAN - Package logging

21.數據包

  • engsoccerdata - 英國和歐洲聯賽結果數據(1871-2016年). 官網:jalapic/engsoccerdata
  • gapminder - 從Gapminder摘錄的數據集. 官網:jennybc/gapminder

22.其他工具

  • git2r - 在R中使用git. 官網:ropensci/git2r

23.其他編譯器

  • CXXR - Refactorising R into C++. 官網:CXXR: Refactorising R into C++
  • fastR - FastR is an implementation of the R Language in Java atop Truffle and Graal. 官網:allr / FastR / wiki / Home
  • incanter - Clojure-based, R-like statistical computing and graphics environment for the JVM with Lisp spirit. 官網:incanter/incanter
  • pqR - 一個更快的R實現. 官網:pqR - a pretty quick version of R
  • renjin - 一個基於JVM的R編譯器. 官網:Renjin.org | The JVM-based interpreter for the R language for statistical computing
  • rho - Refactor the interpreter of the R language into a fully-compatible, efficient, VM for R. 官網:rho-devel/rho
  • riposte - 一個R快速編譯和JIT工具. 官網:jtalbot/riposte
  • RRO - R革命性開放平台(Microsoft R Open). 官網:Microsoft R Open: The Enhanced R Distribution
  • TERR - R的TIBCO企業運行環境. 官網:TIBCO Spotfire - TIBCO Enterprise Runtime for R (TERR)

24.R學習

  • swirl - 一個在R控制台中互動式學習指南. 官網:swirl: Learn R, in R.
  • DataScienceR - 一個數據科學,神經網路,和機器學習的指南. 官網:ujjwalkarn/DataScienceR

25.資源

25.1 網站

  • R-project - R 項目的官方網站. 官網:The R Project for Statistical Computing
  • R Bloggers - R語言的一個綜合性博客網站. 官網:R-bloggers
  • DataCamp - 在線學習R數據分析. 官網:Learn R, Python & Data Science Online | DataCamp
  • Quick-R - 一個非常好的快速參考手冊. 官網:Quick-R: Home Page
  • Advanced R - 書籍高級R編程的在線版. 官網:Welcome · Advanced R.
  • Efficient R Programming - 書籍"Efficient R Programming"的在線主頁. 官網:Efficient R programming
  • CRAN Task Views - CRAN包的任務列表. 官網:CRAN Task Views
  • The R Programming Wikibook - 一個R協作手冊 官網:Wikibooks, open books for an open world
  • R-users - R語言的求職板塊. 官網:Jobs for R-users
  • R Cookbook - 一個R問答網站,由[R Graphics Cookbook]進行支持(shop.oreilly.com/produc). 官網:Cookbook for R
  • tryR - 快速開始使用R. 官網:Try R
  • RDocumentation - 使用RDocumentation搜索所有的CRAN, Bioconductor, Github包和文檔. 官網:RDocumentation

25.2 書籍

  • R Books List - R相關書籍清單. 官網:RomanTsegelskyi/rbooks
  • The Art of R Programming - 一個很好的資源,可以系統地學習基礎類型的對象,控制語句,變數的範圍,以及調試等. 官網:The Art of R Programming
  • Free Books - CRAN貢獻的多種語言文檔. Contributed Documentation in many languages. 官網:Contributed Documentation
  • R Cookbook - 快速簡單的介紹R及相關常見的統計任務. 官網:R Cookbook
  • Johns Hopkins編寫的數據科學專業的一部分教程:
    • Exploratory Data Analysis with R - 基本的各種數據分析技能. * R Programming for Data Science - 依賴於R的一些高級數據分析. * Report Writing for Data Science in R - R語言的報表生成和可重用組件研究. 官網:Exploratory Data Analysis… by Roger D. Peng [PDF/iPad/Kindle]
  • R Packages - 一個用R包編寫的書籍 (有論文和網站2鍾格式). 官網:Welcome · R packages
  • R in Action - 一本旨在幫助所有級別R用戶的書籍. 官網:R in Action, Second Edition
  • Use R! - This series of inexpensive and focused books from Springer publish shorter books aimed at practitioners. Books can discuss the use of R in a particular subject area, such as Bayesian networks, ggplot2 and Rcpp. 官網:Use R! (Titles in this series)
  • R for SAS and SPSS users - 一個對已經熟悉SAS和SPASS用戶的資源庫. 官網:Free Version
  • An Introduction to R - 一個很好的介紹R的文章,也涵蓋了一些高級主題. 官網:cran.r-project.org/doc/
  • Introduction to Statistical Learning with Application in R - A simplified and "operational" version of The Elements of Statistical Learning. Free softcopy provided by its authors. 官網:Introduction to Statistical Learning
  • The R Inferno - Patrick Burns gives insight into R"s ins and outs along with its quirks! 官網:burns-stat.com/pages/Tu
  • R for Data Science - Free book from RStudio developers with emphasis on data science workflow. 官網:R for Data Science

25.3 博客

    • Not So Standard Deviations - 數據科學博客
      • @Roger Peng and @Hilary Parker.
    • R World News - R行業的社區新聞,可以讓你與時俱進.

      • @Bob Rudis and @Jay Jacobs.
    • The R-Podcast - 使用R的一些實踐建議.
      • @Eric Nantz.
    • R Talk - 關於R語言和統計軟體的新聞和討論.
      • @Oliver Keyes, @Jasmine Dumas, @Ted Hart and @Mikhail Popov.

25.4 參考文獻

  • R Reference Card 2.0 - Material from R for Beginners by permission of Emmanuel Paradis (Version 2 by Matt Baggott). 官網:cran.r-project.org/doc/
  • Regression Analysis Refcard - R Reference Card for Regression Analysis. 官網:cran.r-project.org/doc/
  • Reference Card for ESS - Reference Card for ESS. 官網:ess.r-project.org/refca
  • R Markdown Cheat sheet - Quick reference guide for writing reports with R Markdown. 官網:shiny.rstudio.com/image
  • Shiny Cheat sheet - Quick reference guide for building Shiny apps. 官網:shiny.rstudio.com/image
  • ggplot2 Cheat sheet - Quick reference guide for data visualisation with ggplot2. 官網:rstudio.com/wp-content/
  • devtools Cheat sheet - Quick reference guide to package development in R. 官網:rstudio.com/wp-content/

25.5 網路課程

  • The Analytics Edge - Hands-on introduction to data analysis with R from MITx. 官網:The Analytics Edge
  • Johns Hopkins University Data Science Specialization - 9 courses including: Introduction to R, literate analysis tools, Shiny and some more. 官網:Specialization | Coursera
  • HarvardX Biomedical Data Science - Introduction to R for the Life Sciences. 官網:HarvardX Biomedical Data Science Open Online Training Curriculum launches on January 19
  • Explore Statistics with R - Covers introduction, data handling and statistical analysis in R. 官網:Explore Statistics with R

25.6 列表

  • Books - R書籍清單. 官網:RomanTsegelskyi/rbooks
  • DataScienceR - R數據科學、神經網路和機器學習的指南清單. 官網:ujjwalkarn/DataScienceR
  • ggplot2 Extensions - ggplot2擴展案例. 官網:ggplot2 extensions
  • Natural Language Processing - R. @Chinese中NLP 相關資源. 官網:BZRLC/R-notes
  • Network Analysis - 網路分析相關資源. 官網:briatte/awesome-network-analysis
  • Open Data - 使用R獲取,轉換,操作,創建和貢獻數據. 官網:ropensci/opendata
  • Posts - 創建R博客或者文章. 官網:qinwf/awesome-R
  • Package Development - 提高包開發的資源工具. 官網:ropensci/PackageDevelopment
  • R Project Conferences - 使用R的相關信息,DSC會議. 官網:R: Conferences
  • RStartHere - 一些非常有用的R包指南. 官網:rstudio/RStartHere
  • RStudio Addins - RStudio插件清單. 官網:daattali/addinslist
  • Topic Models - 主題模型的學習和R相關資源. 官網:trinker/topicmodels_learning
  • Web Technologies - 如何使用R和萬維網的信息. 官網:ropensci/webservices

大家也可以加小編微信:tswenqu,進R語言中文社區 交流群。

推薦閱讀:

Learn R | 數據降維之因子分析(下)
用數據分析的思路找數據分析的工作

TAG:R编程语言 | 大数据 | 数据挖掘 |