精選 | 2017年10月份R新包

2017年10月份,共計有182個新包發布在CRAN,以下是摘錄的40個較為優秀的R新包,主要包括以下幾個類別:工程學、機器學習、數值方法、科學、統計學、時間序列、工具和可視化等。工程學是首次單獨列為一個類別,這也反映出R在該領域的實踐應用。科學類R包在10月份新包中尤為突出,這主要源於數據科學領域的專家將各種分析技術/方法封裝在R包中,以供相關愛好者直接學習/使用。以下相關類別R包的簡介,希望有助於大家的學習。

一. 工程學

1. FlowRegEnvCost 0.1.1: 基於加西亞·德·賈倫等人的研究,計算了大壩對河流流量調節控制的環境成本 (2017).

2. rroad v0.0.4: 給定一段道路的縱向輪廓,或一個固定長度的分段序列,可對其國際粗糙度指數(IRI)進行計算和可視化分析.

二. 機器學習

1. detrendr v0.1.0: 實現了一種基於諾蘭等人(2017)的演算法,專門用於處理受漂白影響的圖像.

2. MlBayesOpt v0.3.3: 提供一套支持貝葉斯優化方法的計算框架,輔助支持向量機、隨機森林和極端梯度增強模型優化超參數.

3. rerf v1.0: 實現了由Tomita(2016)開發的隨機Forester(RerF)演算法,類似於Breiman(2001)開發的隨機組合(Forest-RC)演算法. 這兩種演算法都使用坐標的線性組合來分割.

三. 數值方法

1. episode v1.0.0: 提供了部分統計工具,支持在常微分方程(ODE)控制的時間過程中推導未知參數.

2. KGode v1.0.1: 實現了Niu等人(2016)提出的核脊回歸和梯度匹配演算法和扭曲演算法(2017).

四. 科學相關

1. adjclust v0.5.2: 實現了層次化聚類的約束版本,其中每個觀測與一個位置相關聯,只有相鄰的集群可以合併.

2. hsdar v0.6.0: 提供轉換反射光譜、計算植被指數和紅色邊緣參數的函數,以及高光譜遙感和模擬的光譜再採樣.

3. mapfuser v0.1.2: 構建與LPmerge一致的遺傳圖譜(見Endelman和Plomion(2014)),建立物理距離與遺傳距離的關係模型.

4. mortAAR v1.0.0: 支持分析和處理考古死亡數據,可參見 Chamberlain (2006).

5. skyscapeR v0.2.2: 支持對天文學相關數據進行數據降維、可視化和分析.

五. 統計學

1. BayesRS v0.1.2: 適用於分層線性貝葉斯模型,並計算出與savage - dickey密度比有關的群參數的貝葉斯因子(見Wetzels et al.(2009).

2. CatPredi v1.1: 允許用戶通過最大化模型的判別能力,將連續預測變數分類為邏輯推理或Cox比例風險回歸設定,可參見Barrio et al. (2015) and Barrio et al. (2017).

3. CovTools v0.2.1: 提供了幾何和推理工具,方便分析協方差結構和多元統計中的協方差分析,可參見Schervish (1987).

4. genlogis v0.5.0: 對Rathie和Swamee (2006)提出的廣義邏輯回歸分布提供了基本的分布函數.

5. emmeans v0.9.1: 提供了許多函數,計算線性/廣義線性/混合模型的估計邊際均值(EMMS).

6. ESTER v0.1.0: 提供一種順序測試的實現,它使用由一組模型的Akaike權重計算的證據比率,詳見Burnham & Anderson (2004).

7. FarmTest v1.0.0: 提供在潛在因素情況下執行穩健的多重測試功能,它利用Huber的損失函數來估計分布參數,並通過近似因子模型計算出在坐標之間的強依賴關係.

8. miic v0.1: 實現了一種信息理論方法,它從純粹的觀測數據中學習因果或非因果圖模型,同時還包括未觀察到的潛在變數的影響.

9. modcmfitr v0.1.0: 擬合修訂版的Connor-Mosimann分布( Connor & Mosimann (1969).

10. pense v1.0.8: 為線性回歸提供了一個魯棒的懲罰彈性網和MM估計器.

11. paramtest v0.1.0: 允許運行模擬或其他函數,同時在一個迭代中改變參數.

12. rENA v0.1.0: 實現了執行認知網路分析(ENA)的功能,用於識別編碼數據中的元素之間的連接,並在動態網路模型中表示它們,從而說明連接的結構,並度量網路中元素之間的關聯強度.

13. rma.exact v0.1.0: 提供在隨機效應模型下計算總體均值的函數.

六. 時間序列

1. carfima v1.0.1: 提供一個便捷工具箱,以適應在連續時間、單變數和不規則時間間隔的時間序列數據上建立集成的ARMA模型(CARFIMA).

2. colorednoise v0.0.1: 提供用於模擬白雜訊(無時間自相關)、紅色雜訊(正時間自相關)和藍色雜訊(負時間自相關)的工具.

3. nnfor v0.9: 提供部分函數,支持利用神經網路方法自動搭建時間序列模型.

七. 工具

1. hdf5r v1.0.0: 提供一個使用R6類的HDF5 API的面向對象包裝器.

2. geoops v0.1.2: 提供針對用GeoJSON地理空間數據進行格式轉換的工具.

3. linl v0.0.2: 添加LaTeX字元類到rmarkdown,使用與rmarkdown相適應的pandoc-letter模板.

4. rcreds v0.6.6: 提供從加密文件讀取和寫入憑證的功能.

5. RMariaDB v1.0-2: 實現與MariaDB and MySQL資料庫兼容的DBI介面.

6. securitytxt v0.1.0: 提供識別和解析security.txt文件的工具,使之能夠分析並採用Web安全策略草案標準.

7. usethis v1.1.0: 自動化包和項目設置任務,包括建立單元測試,測試覆蓋率,持續集成,Git,GitHub,許可證,RStudio項目等等,否則需要手動執行.

8. xltabr v0.1.1: 它提供了可以使用[openxlsx](cran.r -project.org/package= openxlsx)來生成良好格式化的跨列表的函數,它已經被開發用來幫助自動化發布官方統計數據.

八. 可視化

1. iheatmapr v0.4.2: 支持繪製複雜的、互動式的熱圖.

2. otvPlots v0.2.0: 支持自動可視化變數分布,並為大型數據集計算時間匯總匯總統計數據.

附註:本文由黃小偉進行翻譯,限於個人水平,錯誤難免,歡迎多交流


推薦閱讀:

TAG:R编程语言 | 数据分析 | 数据挖掘 |