快訊| 2017年6月份精選R包
2017年6月份,R官方共計發布了238個新包,以下為精選的40個R包,在此做以簡單介紹,便於大家快速了解!此次精選的R包,共計6個類別:生物統計、數據、機器學習、輔助、統計和工具等,以下為各個包的簡介:
一.生物統計
1. BIGL v1.0.1: 實現了藥物協同分析的反應表面方法,包括廣義和經典的Loewe配方.
2. colorpatch v0.1.2:提供顯示編碼摺疊更改的顏色補丁的函數(例如:、對數比)和關係圖中的置信值;尤其用於繪製基因表達數據和其他類型的微分實驗.
3. eesim v0.1.0: 提供模擬環境暴露時間序列的功能(如:環境流行病學的動力分析和模擬研究中使用的溫度、空氣污染和健康結果.
4. personalized v0.0.2: 在陳等人的一般亞群識別框架下,為擬合和驗證子群識別和個性化醫學模型提供了功能.
5. tidygenomics v0.1.0: 提供了部分方法處理基因數據.
二.數據類
1. alfred v0.1.1: 提供對ALFRED和FRED資料庫的直接訪問方法.
2. CityWaterBalance v0.1.0: 提供檢索數據的功能,並通過城市網路估計未測量的水流。使用此包和依賴項,可以通過web服務收集美國城市的數據.
3. censusapi v0.2.0: 其為美國人口普查局api提供一個包裝器,它返回人口普查數據和元數據的數據幀。現有的數據集包括十年一次的人口普查、美國社區調查、小面積健康保險概算、小面積收入和貧困估計、人口估計和預測.
4. dataverse v0.2.0: 提供對 Dataverse api的訪問,支持數據搜索、檢索和存儲.
5. data.world v1.1.1: 提供了高質量的工具,用戶處理 data.world中的相關數據集.
6. SimMultiCorrData v0.1.0: 提供了生成連續、二進位、序數和計數變數的函數,這些變數具有指定的關聯矩陣,可以用來模擬模擬真實場景的數據集.
7. tidycensus v0.1.2: 其為美國人口普查和美國社區調查api,以及美國人口普查局的地理邊界檔案提供一個綜合的R介面.
8. ukbtools v0.9.0: 提供了一系列工具,用於處理 UK Biobank datasets.
9. wpp2017 v1.0-1:其為來自聯合國世界人口展望2017的數據集提供和介面.
三.機器學習
1. cld3 v1.0: 其為谷歌的實驗緊湊語言探測器3演算法提供了一個介面,這是一種神經網路模型,用於語言識別,是cld2的後續.
2. datafsm v0.2.0: 實現了一種自動生成動態決策模型的方法,該模型具有很強的預測能力,並且可以按人的術語解釋.
3. diceR v0.1.0: 使用集成集群框架為集群分析提供功能.
4. glmertree v0.1-1:實現了基於(廣義)線性混合模型的遞歸劃分.
5. greta v0.2.0:允許用戶在R中編寫統計模型,並通過MCMC對cpu和gpu進行匹配,使用谷歌TensorFlow.
6. penaltyLearning v2017.07.11:利用最大餘量間隔回歸,實現了對變點檢測的稀疏懲罰演算法.
7. SentimentAnalysis v1.2-0:使用各種現有的字典,例如哈佛四,或金融特定的字典來執行對文本數據的情感分析,並創建自定義的字典.
四.輔助綜合類
1. convexjlr v0.5.1: 其為Julia包凸提供高級包裝,便於描述和解決凸優化問題.
2. interp v1.0-29: 使用線性方法或樣條實現規則網格和不規則網格的雙變數數據插值.
3. pkggraph v0.2.0: 允許用戶互動式地探索和策劃針對CRAN的包依賴項.
4. parallelDist v0.1.1: 提供了一個並行的替代R的本地dist函數來計算連續的、二進位的和多維的輸入矩陣的距離矩陣,並支持來自統計、prox和dtw R包的廣泛的距離函數 .
五.統計類
1. anchoredDistR v1.0.3:該軟體實現了錨定分布的方法,用於推斷地質統計參數.
2. bssm v01.1-1:通過粒子馬爾可夫鏈蒙特卡洛和重要採樣類型修正馬爾可夫鏈蒙特卡羅方法對國家空間模型進行貝葉斯推理的有效方法.
3. factorMerger v0.3.1 提供一組工具來支持事後測試的結果,並能夠提取各種因素的層次結構.
4. MittagLeffleR v0.1.0: 提供了基於Garrappa演算法的mittag - leffler分布的密度、分布、量化函數以及隨機變數生成.
5. walker v0.2.0: 提供了建立動態貝葉斯回歸模型的函數,其中回歸係數隨時間變化而變化.
六.工具類
1. charlatan v0.1.0: 提供製作假數據的功能,包括地址、人名、日期、時間、顏色、坐標、貨幣、DOIs、工作、電話號碼、DNA序列、從分布範圍內到範圍內的整數和整數.
2. colordistances v0.8.0: 提供了載入和顯示圖像的功能,有選擇地屏蔽了特定的背景顏色,以顏色為單位像素,以量化的方式測量圖像之間的顏色相似性,並通過對象顏色的相似度來進行聚類圖像.
3. dbplyr v1.1.0: 其為資料庫實現一個dplyr的後端,允許使用遠程資料庫表的工作,就像它們是內存中的數據幀一樣.
4. geofacet v0.1.5:提供geofaciting功能(能夠為不同的地理實體安排一系列的地塊,以保存一些地理方位)用於ggplot2.
5. ggformula v0.4.0: 提供了一個公式介面針對ggplot2.
6. gqlr v0.0.1: 提供由Facebook創建的GraphQL查詢語言的實現,用於描述複雜應用程序數據模型的數據需求。gqlr應該有助於將R計算集成到使用GraphQL的生產應用程序中.
7. later v0.3:允許用戶在當前時間後的某個時間執行任意的R或C函數,在R執行堆棧清空之後.
8. secret v1.0.0: 允許共享敏感信息,如密碼、API密鑰等,在R包中使用公鑰加密.
9. sessioninfo v1.0.0: 提供查詢和列印當前R會話的信息的函數。它類似於toutils::sessionInfo(),但包含更多的信息.
10. webglobe v1.0.2:提供在互動式3D地球上顯示地理空間數據的功能.
本文翻譯:黃小偉 .歡迎大家批評指正,多交流!
推薦閱讀:
※數據地圖多圖層對象的顏色標度重疊問題解決方案
※數據分析領域裡,R和Python到底哪個市場需求大?
※數據分析學習階段小結
※我為什麼要在Excel和R之間徘徊——數據分析者的基本修養
※簡單數據分析