PolYamoR的簡介:Python和R之間的雙向翻譯器
時至今日,數據科學已經成為Python和R之間的主戰場。在數據科學裡,存在著讓不同編程語言共存的方式。
但是編程語言的共存也有它的規則,就算是 Dataiku Data Science Studio (DSS) 系統可以使其順暢,但是並非每個人都準備好接受這種共存的狀態。
大家期待已久的解決方案
經過一年緊張的發展後,我們終於自豪地宣布PolYamoR —— 第一個可以在Python和R之間可以正向和反向的自動化翻譯系統。PolYamoR是第一個能達到全透明,不矛盾、並且管理複雜編程的多語言編程系統。PolYamoR可以使純Python代碼翻譯成純R代碼,反之亦然,這將引領一個意想不到的跨文化交流的新時代。
編碼來源於GitHub
https://github.com/dataiku/PolYamoR
現代的翻譯系統依靠深度學習去運作。當然,PolYamoR也不例外。
我們通過提供數百萬行Python代碼和數百萬行R代碼,以及它們各自的翻譯,訓練出一個循環性的神經網路(Neural Network)。
當然,最早一次的翻譯是很粗糙的。
驚艷的圖型處理器(GPU)集群
經過十多個圖形處理器,包含20個節點集群數千小時的訓練,PolYamoR生成並清理出易於管理的代碼。但是所產生的代碼可能會特別長:
四不像?
PolYamoR最初由Python編寫,但是因為一個團隊成員的編碼錯誤,該程序決定自行翻譯為R。在改變主意以後,PolYamoR 現在是一半Python一半R並且足夠穩定地去生產使用。
我們相信PolYamoR將會改變數據科學團隊每日合作方式。很有可能在未來一天,一門通用語將會在不同層面的編程系統中產生並且使所有數據科學家的工作統一。但是與此同時,你可以根據自己的喜好,嘗試染指R語言,或者Python,盡情享受數據科學裡的編程之趣直到明年PolYamoR的亮相!
原文:Pandas Cheat Sheet for Data Science in Python
作者:Karlijn Willems
鏈接:https://goo.gl/wmnpSy
推薦閱讀:
※R|數據處理|list的轉化與轉置
※R語言金融波動率建模|基於SGED分布的變參數ARIMA+EARCH動態預測模型的研究
※【Kaggle實例分析】Titanic Machine Learning from Disaster
※乾貨--線性回歸模型與CART樹的比較