精選 | 2017年10月份R新包
2017年10月份,共計有182個新包發布在CRAN,以下是摘錄的40個較為優秀的R新包,主要包括以下幾個類別:工程學、機器學習、數值方法、科學、統計學、時間序列、工具和可視化等。工程學是首次單獨列為一個類別,這也反映出R在該領域的實踐應用。科學類R包在10月份新包中尤為突出,這主要源於數據科學領域的專家將各種分析技術/方法封裝在R包中,以供相關愛好者直接學習/使用。以下相關類別R包的簡介,希望有助於大家的學習。
一. 工程學
1. FlowRegEnvCost 0.1.1: 基於加西亞·德·賈倫等人的研究,計算了大壩對河流流量調節控制的環境成本 (2017).
2. rroad v0.0.4: 給定一段道路的縱向輪廓,或一個固定長度的分段序列,可對其國際粗糙度指數(IRI)進行計算和可視化分析.
二. 機器學習
1. detrendr v0.1.0: 實現了一種基於諾蘭等人(2017)的演算法,專門用於處理受漂白影響的圖像.
2. MlBayesOpt v0.3.3: 提供一套支持貝葉斯優化方法的計算框架,輔助支持向量機、隨機森林和極端梯度增強模型優化超參數.
3. rerf v1.0: 實現了由Tomita(2016)開發的隨機Forester(RerF)演算法,類似於Breiman(2001)開發的隨機組合(Forest-RC)演算法. 這兩種演算法都使用坐標的線性組合來分割.
三. 數值方法
1. episode v1.0.0: 提供了部分統計工具,支持在常微分方程(ODE)控制的時間過程中推導未知參數.
2. KGode v1.0.1: 實現了Niu等人(2016)提出的核脊回歸和梯度匹配演算法和扭曲演算法(2017).
四. 科學相關
1. adjclust v0.5.2: 實現了層次化聚類的約束版本,其中每個觀測與一個位置相關聯,只有相鄰的集群可以合併.
2. hsdar v0.6.0: 提供轉換反射光譜、計算植被指數和紅色邊緣參數的函數,以及高光譜遙感和模擬的光譜再採樣.
3. mapfuser v0.1.2: 構建與LPmerge一致的遺傳圖譜(見Endelman和Plomion(2014)),建立物理距離與遺傳距離的關係模型.
4. mortAAR v1.0.0: 支持分析和處理考古死亡數據,可參見 Chamberlain (2006).
5. skyscapeR v0.2.2: 支持對天文學相關數據進行數據降維、可視化和分析.
五. 統計學
1. BayesRS v0.1.2: 適用於分層線性貝葉斯模型,並計算出與savage - dickey密度比有關的群參數的貝葉斯因子(見Wetzels et al.(2009).
2. CatPredi v1.1: 允許用戶通過最大化模型的判別能力,將連續預測變數分類為邏輯推理或Cox比例風險回歸設定,可參見Barrio et al. (2015) and Barrio et al. (2017).
3. CovTools v0.2.1: 提供了幾何和推理工具,方便分析協方差結構和多元統計中的協方差分析,可參見Schervish (1987).
4. genlogis v0.5.0: 對Rathie和Swamee (2006)提出的廣義邏輯回歸分布提供了基本的分布函數.
5. emmeans v0.9.1: 提供了許多函數,計算線性/廣義線性/混合模型的估計邊際均值(EMMS).
6. ESTER v0.1.0: 提供一種順序測試的實現,它使用由一組模型的Akaike權重計算的證據比率,詳見Burnham & Anderson (2004).
7. FarmTest v1.0.0: 提供在潛在因素情況下執行穩健的多重測試功能,它利用Huber的損失函數來估計分布參數,並通過近似因子模型計算出在坐標之間的強依賴關係.
8. miic v0.1: 實現了一種信息理論方法,它從純粹的觀測數據中學習因果或非因果圖模型,同時還包括未觀察到的潛在變數的影響.
9. modcmfitr v0.1.0: 擬合修訂版的Connor-Mosimann分布( Connor & Mosimann (1969).
10. pense v1.0.8: 為線性回歸提供了一個魯棒的懲罰彈性網和MM估計器.
11. paramtest v0.1.0: 允許運行模擬或其他函數,同時在一個迭代中改變參數.
12. rENA v0.1.0: 實現了執行認知網路分析(ENA)的功能,用於識別編碼數據中的元素之間的連接,並在動態網路模型中表示它們,從而說明連接的結構,並度量網路中元素之間的關聯強度.
13. rma.exact v0.1.0: 提供在隨機效應模型下計算總體均值的函數.
六. 時間序列
1. carfima v1.0.1: 提供一個便捷工具箱,以適應在連續時間、單變數和不規則時間間隔的時間序列數據上建立集成的ARMA模型(CARFIMA).
2. colorednoise v0.0.1: 提供用於模擬白雜訊(無時間自相關)、紅色雜訊(正時間自相關)和藍色雜訊(負時間自相關)的工具.
3. nnfor v0.9: 提供部分函數,支持利用神經網路方法自動搭建時間序列模型.
七. 工具
1. hdf5r v1.0.0: 提供一個使用R6類的HDF5 API的面向對象包裝器.
2. geoops v0.1.2: 提供針對用GeoJSON地理空間數據進行格式轉換的工具.
3. linl v0.0.2: 添加LaTeX字元類到rmarkdown,使用與rmarkdown相適應的pandoc-letter模板.
4. rcreds v0.6.6: 提供從加密文件讀取和寫入憑證的功能.
5. RMariaDB v1.0-2: 實現與MariaDB and MySQL資料庫兼容的DBI介面.
6. securitytxt v0.1.0: 提供識別和解析security.txt
文件的工具,使之能夠分析並採用Web安全策略草案標準.
7. usethis v1.1.0: 自動化包和項目設置任務,包括建立單元測試,測試覆蓋率,持續集成,Git,GitHub,許可證,RStudio項目等等,否則需要手動執行.
8. xltabr v0.1.1: 它提供了可以使用[openxlsx](https://cran.r http://-project.org/package= openxlsx)來生成良好格式化的跨列表的函數,它已經被開發用來幫助自動化發布官方統計數據.
八. 可視化
1. iheatmapr v0.4.2: 支持繪製複雜的、互動式的熱圖.
2. otvPlots v0.2.0: 支持自動可視化變數分布,並為大型數據集計算時間匯總匯總統計數據.
附註:本文由黃小偉進行翻譯,限於個人水平,錯誤難免,歡迎多交流
推薦閱讀: