快訊 | 2017年9月R新包一覽

2017年9月份,在官方CRAN發布了222個新包,以下為從中選取的部分R新包,主要包括六個類別:

1. 計算方法

2. 機器學習

3. 科學相關

4. 統計相關

5. 工具類

6. 可視化

一. 計算方法

1. DES v1.0.0: 實現了面向事件的離散事件模擬方法.

2. JuliaCall 0.9.3: 提供了R與Julia的介面,支持相關操作.

3. Rlinsolve v0.1.1: 實現了稀疏線性方程組的迭代求解,包括使用雅可比、高斯-賽德爾、連續的超鬆弛和SSOR方法和非平穩、克里洛夫子空間方法的基本固定迭代解.

4. sdpt3r v0.1: 實現了Toh、Todd和Tutuncu的SDPT3方法,解決了半定線性規劃問題,該包中包含了多個實踐案例,便於大家的學習.

5. VeryLargeIntegers v0.1.4: 在不損失精度的情況下,提供了多個處理任意大整數的工具.

二. 機器學習

1. bnclassify v0.3.3: 實現了從數據中學習離散貝葉斯網路分類器的演算法.

2. DMRnet v0.1.0: 為回歸和分類問題提供模型選擇演算法,在該演算法中,預測因子可以是數值和分類的.

3. ELMSurv v0.4: 實現了一個進行生存分析的學習器.

4. fastrtext v0.2.1: 提供了針對Facebook的快速文本庫的數據介面,可以進行相關的文本處理和分類.

5. FSelectorRcpp v0.1.8: 基於多區間離散化的稀疏矩陣支持,通過Rcpp實現了基於熵的特徵選擇演算法.

6. googleLanguageR v0.1.0: 提供了谷歌雲機器學習API介面,支持進行文本和語音任務學習.

7. leabRa v0.1.0: 實現了Leabra(本地的、錯誤驅動的和關聯的、生物現實的演算法),允許構建具有生物學現實意義的人工神經網路,並在一個框架內實現監督和非監督學習的平衡.

8. lime v0.3.0: Python包的一個埠,它試圖通過訓練本地模型來解釋黑盒模型的結果.

9. slowraker v0.1.0: 實現了RAKE演算法,可以在沒有任何訓練數據的情況下從文檔中提取關鍵字

10. udpipe v0.1.1: 提供一個自然語言處理工具包,進行詞語切分、詞類標記及原始文本的依賴性分析等.

三. 科學相關

1. afpt v1.0.0: 實現了克萊因·赫倫巴內等人所描述的空氣動力模型,並對脊椎動物飛行的飛行成本進行了估計和建模.

2. soundgen v1.1.O: 提供了用於聲音合成和聲學分析的工具.

四. 統計相關

1. cr17 v0.1.0: 提供分析競爭風險模型的工具,包括測試組之間的差異(灰色和灰色),以及生存的可視化和累積的發生率曲線.

2. EAinference v0.2.1: 提供了對高維數據的統計推斷的估計方法.

3. fdAnova v0.1.0: 提供對單變數和多變數功能數據的方差檢驗過程進行分析的函數.

4. geex v1.0.3: 提供了一個通用的、靈活的框架,用於估計參數和經驗的夾層方差估計的一組無偏估計方程.

5. mosaicModel v0.3.0: 提供評估、顯示和解釋統計模型的功能,目標是將模型的操作從模型的特定架構抽象出來.

6. odr v0.3.2: 提供了在固定預算和成本結構下的多級隨機試驗中最小化治療效果差異的樣本分配方法,以及在不適應成本和預算的情況下進行電力分析.

7. mvord v0.1.0: 提供了一個靈活的框架,用於擬合多變數回歸模型.

8. OultiersO3 v0.2.1: 提供了識別數據集變數的所有組合的潛在異常值的方法.

9. powerlmm v0.1.0: 採用分析和模擬的方法,針對缺失數據進行多級的縱向研究學習.

10. randnet v0.1: 為一類隨機網路模型提供模型選擇和參數優化程序.

11. threshr v1.0.0: 提供了部分函數,針對為在極端值模型中閾值的選擇,主要基於Northrop, Attalides and Jonathan的方法.

12. tscount v1.4.0: 提供針對廣義線性模型的計數時間序列的模型擬合和評估、預測和干預分析方法.

五. 工具類

1. basictabler v0.1.0: 提供部分有用的函數,通過數據框、矩陣創建和操作表格(逐行或者逐列),並且可以通過HTML、HTML widgets或者Excel展示.

2. bigstatsr v0.2.2: 使用文件支持的矩陣提供可伸縮的統計工具.

3. keyring v1.0.0: 提供一個獨立於平台的API來訪問操作系統的憑據庫.

4. re2r v0.2.0: 提供了一個針對谷歌正則表達式引擎介面,其在匹配大量文本時速度非常快.

5. tibbletime v0.0.2: 是tibble包的一個擴展,支持創建時態感知的tibble對象.

六. 可視化

1. egg v0.2.0: 提供了許多函數對ggplot2圖形進行展示優化,以下為一個簡單示例.

2. ggridges v0.4.1: ggplot2 包的擴展,支持繪製山脊線,可以進行基於時間和空間的變化的可視化.

3. linemap v0.1.0: 提供了通過曲線創建地圖的函數,以下為一個簡單示例.

備註:本文由黃小偉翻譯,限於個人水平,錯誤在所難免,請大家多指導!

weixin.qq.com/r/Lkyqssv (二維碼自動識別)

推薦閱讀:

如何評價北京朝陽大悅城的數據分析手段及其基於數據的運營?
猴子 的 Live - 每天1小時,從零學會大數據核心
其實你根本不懂RStudio的用心良苦!
R|ggplot2(三)|coord 系列函數坐標軸轉換

TAG:R编程语言 | 数据分析 | 数据科学家 |