快訊 |2017年8月R新包推薦

2017年8月份,有180個新包在CRAN發布,略少於前幾個月。本文節選了其中部分R新包,包含7個類別:數據、機器學習、綜合類、科學、統計學、工具及可視化等。以下主要針對各個包的主要功能特性進行說明,希望有助於大家的學習。

一. 數據相關

1. edgarWebR v0.1.1: 提供訪問和分析美國證券交易委員會的實時提交信息的方法,包括公司和基金文件以及相關的元數據.

2. forwards v0.1.0: 提供了由Forwards調查獲取的匿名數據,目前提供了useR! 2016參會者的數據集,以下是關於參會者數據的展示:

3. GeoMongo v1.0.1: 提供了利用PyMongo庫中的相關方法對GeoJson數據進行初始化、插入、訪問等操作.

4. Rnightlights v0.1.2: 提供了介面,支持從美國國家海洋和氣象管理局的免費資料庫下載相關區域統計數據.

5. Knoema v0.1.7: 支持訪問Knoema(互聯網上最大的公共數據和統計數據集合之一),獲取來自大量數據源的時間序列數據.

6. rwalkr v0.3.1: 支持以規範的數據格式,獲取墨爾本行人數據.

7. vegetable v0.1.0: 提供從植被圖資料庫中導入和操作數據的功能,特別是在渦輪增增器中存儲的數據.

二. 機器學習

1. partitionComparison v0.2.2: 為比較同一組對象的兩個分區提供了一些度量(不同、距離/度量、相關、熵).

2. spm v1.0.0: 介紹了用於空間預測建模的地理統計和機器學習方法的混合方法.

三. 綜合類

1. LearnGeom v1.0: 提供學習和教學基本平面幾何的功能,目的是幫助有少量編程技能的年輕學生.

四. 科學

1. PGRdup v0.2.3.2: 提供部分功能,以幫助識別植物遺傳資源收集中可能存在的或可能的重複.

2. snpReady v0.9.3: 提供清潔、總結和準備基因組數據集的功能,以基因組選擇和基因組關聯分析,並估計種群遺傳參數.

五. 統計

1. blink v0.1.0: 實現了在Steorts中執行模型,該模型執行用於分類和文本數據的Bayesian實體解析,用於用戶定義的任何距離函數.

2. cholera v0.2.1: 約翰·斯諾的1854年倫敦霍亂爆發的地圖,初始數據來自Rusty Dodson和Waldo Tobler 1992年的《雪花地圖數字化》,這些數據已經不可用,但是現在可以通過HistData包直接獲取.

3. drtmle v1.0.0: 針對一致性和漸近正態范得拉的一致性和因果效應,提供了針對反事實的最低基於損失的估計.

4. esvis v0.1.0: 提供多種方法來估計和可視化影響大小的分配差異,重點是評估兩個或多個分布之間的差異,而不是單個點.

5. fuser v1.0.0: 提供跨異構子組的高維懲罰回歸函數,相關模型在 Dondelinger and Mukherjee中有詳細描述.

6. gamlss.spatial v1.3.4: 為適應高斯馬爾可夫隨機場域的位置尺度和形狀演算法提供了合適的函數.

7. INLAutils v0.0.4: 提供了一些函數,支持利用隱含高斯馬爾可夫隨機場(GMRF)的新的統計推斷方法來求解模型.

8. missRanger v1.0.0: 提供了由Stekhoven和Buehlmann引入的混合類型數據集的MissForest演算法的實現.

9. naniar v0.1.0: 提供了部分數據結構和函數,便於進行缺失值可視化.

10. powdist v0.1.3: 提供密度、分布和分位數函數,以及由功率和反轉功率分布隨機抽取的函數.

11. skpr v0.35.1: 它是一個開源的實驗套件設計,用於生成和評估R的最優設計.

六. 工具

1. blastula v0.1: 允許用戶編寫並發送HTML電子郵件消息,在一系列電子郵件客戶端和設備大小中呈現。消息是使用Markdown和一個文本插值系統組成的,允許在消息主體內注入評估的R代碼.

2. blogdown v0.1:支持使用Markdown書寫博客和網頁.

3. cetcolor v0.1.0: 提供了一本由Peter Kovesi所描述的視覺上一致的彩色地圖.

4. googledrive v0.1.1: 請參閱google drive網站,了解如何開始打包的示例和說明.

5. pointblank v0.1: 提供系列函數驗證和處理本地數據框文件,可以是tibble對象 、csv文件、MySQL表等.

6. reqres v0.2.0: 提供功能,以方便解析HTTP請求、創建適當的響應以及處理與HTTP交換工作相關的管理.

7. rmapzen v0.3.3: 提供Mapzen 介面,支持地理搜索和地理編碼、等時計算和矢量數據繪製地圖.

8. spelling v1.0: 針對常見的文檔,提供文檔格式拼寫檢查,包括latex文件、markdown等.

9. writexl v0.2: 提供了基於 libxlsxwriter的方便的,輕量級的數據框到xlsx的轉換工具.

七. 可視化

1. billboarder v0.0.3: 提供了htmlwidgets到 billboard.js的介面,基於D3 v4+ ,圖形類型包括線型圖、條形圖、餅圖等.

2. cdparcoord v1.0.0: 提供了針對大型數據集和缺失值的解析度繪製並行坐標的函數.

3.gggenes v0.2.0: 提供了ggplot2 的幾何對象和幫助函數,用於繪製基因箭頭地圖.

4.quickplot v0.1.1: 提供一個高級繪圖系統,使用「網格」圖形來構建,對速度和模塊性進行了優化.

5. treemapify v2.3.2: 提供ggplot2 的幾何對象,用於繪製樹形圖.

附註:本文由黃小偉翻譯,如有錯誤之處,請見諒並告知,互相交流學習!

weixin.qq.com/r/Lkyqssv (二維碼自動識別)


推薦閱讀:

閃電約會數據
給30個PM拉了一年的sql,我學到了這些

TAG:R编程语言 | 数据分析 | 数据挖掘 |