快訊 | 5月份新包推薦

5月份,有229個新包在CRAN發布,本文節選了其中有特色的新包做以簡單概述,想要查看所有包的信息,可在官網查看。本文主要包括以下幾個類別:數據、數據科學和機器學習、教育、統計和工具、其他。

一. 數據類

1.angstroms v0.0.1: 針對區域海洋建模系統(ROMS),提供了多個有用函數進行相關處理;

2.bikedata v0.0.1: 支持下載、匯總全球公共自行車系統數據;

3. dwapi v0.1.1: 提供了多個數據處理函數及應用編程介面;

4. HURDAT v0.1.0: 提供了很多颶風研究所需數據集,如最著名的大西洋颶風和熱帶風暴等;

5. neurohcp v0.6: 提供了人腦連接組研究的交互介面;

6. osmdata v0.0.3: 提供了部分函數,支持地圖數據的下載和導入操作;

7. parlitools v0.0.4: 提供了多種工具,支持分析和挖掘英國政治相關數據;

8. rerddap v0.4.2: 支持R連接 NOAA』s ERDDDAP數據服務端,進行相關操作;

9. soilcarbon v1.0.0:提供了多種工具,分析由鮑威爾中心工作組提供的土壤碳含量數據;

10. suncalc v0.1: 提供了與『suncalc.js』庫的交互介面;

二. 數據科學與機器學習

1. EventStudy v0.3.1:提供了 EventStudy的交互介面;

2. kmcudaR v1.0.0: 提供了一個更快速的、效果更優的聚類演算法,相比K-Means而言;

3. openEBGM v0.1.0: 提供了基於貝葉斯方法的數據挖掘思路,針對購物籃問題;

4. spacyr v0.9.0: 提供了調用python spaCy自然語言處理庫的工具和方法,支持在R中進行相關操作;

三.教育類

1. learnr v0.9: 提供了一套工具,支持使用Markdown等工具創建互動式的教程,進行R和R包的學習;

2. olsrr v0.2.0: 提供了幾個工具,輔助進行普通最小二乘回歸的學習和實踐;

3. rODE v0.99.4: 包含了許多函數,展示學生的一些自然狀態下的表現,如常微方程如何求解、如何更有效的構建方程等;

四.統計類

1. adaptiveGPCA v0.1: 自適應的主成分分析演算法實踐;

2. BayesNetBP v1.2.1: 在 Cowell論文的基礎上,對貝葉斯網的思路和演算法進行相關介紹和實踐;

3. sfdct v0.0.3:提供了部分函數,支持針對簡單的對象構建德勞內三角;

4. simglm v0.5.0: 提供了多個函數,進行線性和廣義線性模型的模擬;

五.工具類

1. checkarg v0.1.0: 提供了一些工具函數,便於進行其他函數參數的校驗;

2. CodeDepends v0.5-3: 提供的一些工具,支持分析R的表達式、代碼塊,並確定它們之間的依賴關係;

6. desctable v0.1.0: 支持創建常見的表格,進行對比、描述性分析,並以csv格式進行存儲;

7. lifelogr v0.1.0: 提供了一個框架,針對多個數據源的數據進行匯總、處理;

8. rlang v0.1.1: 提供了一套工具,進行R基礎類型、內核特徵等相關操作;

9. readtext v0.50: 提供了多個函數,支持文本文件或格式化的文本文件的導入和其他處理工作,常見格式有『.csv』, 『.tab』, 『.json』, 『.xml』, 『.pdf』, 『.doc』, 『.docx』, 『.xls』, 『.xlsx』 等;

10. tatoo v1.0.6: 提供了多個函數進行數據框重構,增加元數據等操作;

六.可視化

1. ContourFunctions v0.1.0: 提供了部分函數,支持創建等高線圖;

2. mbgraphic v1.0.0: 支持通過二步處理法描述單變數、多變數;

3. polypoly v0.0.2: 提供了多個工具,支持重構、繪製和操作正交多項式的矩陣;

4. RJSplot v2.1: 提供了多個函數,支持在R中創建互動式圖形;

七.其他類

1. atlantistools v0.4.2: 提供了一些工具,支持獲取亞特蘭提斯框架,進行海洋生態系統建模;

2. phylodyn v0.9.0: 提供了統計工具,支持根據基因數據重構人口規模預測等相關操作;


推薦閱讀:

計算廣告訓練與平滑思想(上)
2017年度15個最好的數據科學領域Python庫
2017年安全數據科學領域的4個趨勢:機器人、威脅情報、對抗機器學習以及深度學習是如何影響安全領域的
9個不錯的數據可視化工具
直播 | Facebook Analytics Manager如何運用300PB海量資料庫?

TAG:R编程语言 | 数据挖掘 | 数据科学家 |