R的作圖能力相比tableau如何?

兩者同為進行探索性數據分析,開源的R在功能上有何優勢?tableau能否完全實現R(ggplot2)的功能?


Tableau與R對比可以從多方面比較,簡單有一下幾個方面,

1.從開發的角度講,Tableau開發上手容易效率高,只要有excel的基礎,1天內Tableau就可以出門,並且對數據的導入和載入都是嚮導式,簡單明了,但是R是完全靠代碼實現的,需要單獨理解和學習一下R腳本;

2.從使用角度講,Tableau可以實現互動式報表,讓用戶自己參與和發現問題,可視化效果當然也比R要絢麗很多,R一般是一份靜態的統計報告,交互性差,尤其是對不懂統計學的用戶,理解起來太有難度;

3.從架構上講,Tableau是C/S開發,B/S訪問,用戶只需安裝瀏覽器即可完成報表的瀏覽,但是R是C/S開發,如有用戶需要使用則需要每人安裝一個R軟體, 不過R語言生成的報告可以是markdown格式,也可以輸出為html和PDF等格式

4.從費用上講,Tableau為商業軟體,有廠商或者代理商的服務能跟上,同時需要付出相應的報酬,R為開源軟體,免費,但是有問題無法很快解決或者沒有人幫你解決,但是也有很多愛好者在一些網站上發表一些帖子,可以參考;

5.從目的上講,Tableau適合將結果用圖形化的方式表達出來,R適合數據探索和數據挖掘,當然Tableau中也可以調用R的演算法;

所以使用什麼軟體主要看用來做什麼,當然也可以結合使用,目的就是解決問題,做自己擅長做的事情就好了


作者:wuliashine鏈接:R的作圖能力相比tableau如何? - wuliashine 的回答 - 知乎來源:知乎著作權歸作者所有,轉載請聯繫作者獲得授權。

Tableau與R對比可以從多方面比較,簡單有一下幾個方面,

1.從開發的角度講,Tableau開發上手容易效率高,只要有excel的基礎,1天內Tableau就可以出門,並且對數據的導入和載入都是嚮導式,簡單明了,但是R是完全靠代碼實現的,需要單獨理解和學習一下R腳本;

2.從使用角度講,Tableau可以實現互動式報表,讓用戶自己參與和發現問題,可視化效果當然也比R要絢麗很多,R一般是一份靜態的統計報告,交互性差,尤其是對不懂統計學的用戶,理解起來太有難度;

3.從架構上講,Tableau是C/S開發,B/S訪問,用戶只需安裝瀏覽器即可完成報表的瀏覽,但是R是C/S開發,如有用戶需要使用則需要沒人安裝一個R軟體;

4.從費用上講,Tableau為商業軟體,有廠商或者代理商的服務能跟上,同時需要付出相應的報酬,R為開源軟體,免費,但是有問題無法很快解決或者沒有人幫你解決,但是也有很多愛好者在一些網站上發表一些帖子,可以參考;

5.從目的上講,Tableau適合將結果用圖形化的方式表達出來,R適合數據探索和數據挖掘,當然Tableau中也可以調用R的演算法;所以使用什麼軟體主要看用來做什麼,當然也可以結合使用,目的就是解決問題,做自己擅長做的事情就好了

這個回答已經做得比較全面了,我在這裡稍微展開一下:

1. 贊同,開發角度來說是的,兩個軟體針對的用戶其實是兩類人

  • Tableau的面向對象是Data Analyst,只要你會倒騰excel,csv等基本格式的數據,簡單的導入一下然後調試一下各種filter,可以非常短時間內生成高質量可視化report。如果你還會一點sql,會倒騰google big query之類,基本上就能touch到tableau的天花板了。
  • R面向的還是以統計學家等為主的Data Scientist,學習其語法是必須的,儘管R的語法是非常簡單的,但對於零基礎的Business Analyst來說可能就沒有必要學習。數據可視化也只是R的功能之一,建模等統計學習才是R的核心作用。

2. ggplot以前是過去式了,基本上是學術論文生成靜態pdf用的比較多。隨著Rstudio這樣IDE的發展,社區里rmarkdown, shiny之類技術的不斷成熟,其實R現在在可視化上早已經不是以前簡陋的模樣,只需要相對少量的code就能夠實現交互性極強的dashboard:Shiny - Gallery
更多的可視化工具可以在這個答案里找到有哪些值得推薦的數據可視化工具? - 數據分析 - 知乎
當然還是那個問題,不管再簡單總有學習成本,對於不會編程的BA來說,遠不如老闆直接買個tableau的lisence實在

3. Tableau有雲端接入口,也有跨平台的各種客戶端,展示report設計好後可以上傳雲端共享。R的話如果只是分享展示用圖表或者report,可以直接將圖表保存為圖片格式,或者基於markdown的html格式,瀏覽者並不需要有編程技能。除此之外,如果懂一點伺服器架設可以上傳到雲端做自己的展示用web application,或者直接用shiny配套的伺服器(收費的),每次只用一兩行code非常簡單。(again,這裡還是學習成本,對於BA來說Tableau可以全程圖形界面到底)

4. Tableau具體的收費我不太清楚,但企業級的lisence應該不便宜,北美這邊有學生計劃,用學生郵箱註冊可以免費使用一年,或者政治不正確的下個盜版,本地用用基本沒有問題。R的話本身就是開源的,你折騰出什麼花兒來都不要錢,當然你學習的時間成本在這個地方,只是說如果你的規劃是在數據科學這條路上漸行漸遠的話,肯定是值得的。

5. 贊同
如果你已經不滿足於Tableau模板中的可視化,R那些簡單介面的圖表也無法滿足你,那麼你可能要從javascript開始學習前端的可視化開發了,比如D3.js之類的項目。當然這又是個大坑這裡不展開了。

這個補充只是在原文上對R的功能進行一些修正,但重要的事情再說一遍,選擇什麼工具還是要看team本身的環境,tableau雖然相對功能有局限,對海量數據處理比較吃硬體,但畢竟簡單易上手,不需要編程技能。R功能強大,除了數據可視化還有很多功能可以發掘,相對學習成本較高,隊伍里本身沒有統計,計算機或者數據出身的人可能帶不動,這樣專門請一個人來做成本其實也上去了。所以還是要圍繞具體的環境和你們的目的來選擇工具。

以上 (去年從事R可視化開發幾個月)


好問題!對於數據分析師來說,最大的產出應該是分析得到的結論以及帶來的深層次影響,因此,能夠選擇合適的工具來解決相應的問題從時間投入上來說更具性價比。

在正式討論前,我們可以先看一下這幅圖1:

這幅圖的橫向代表工具的適用範圍,縱向代表工具的易用程度(多快可以把問題解決)。從中我們可以看到 R 和 Tableau 的位置,也可以比較好地理解兩者的區別:R 可以解決更多的問題,特別是在數據處理 (如 tidyR, dplyer) 和第三方可視化插件(如 plotly, googleVis)擁有非常大的優勢。但是 R 在作圖效率上確實差 Tableau 太多,用 Tableau 花一個小時搭建的可視化交互儀錶板,用 R 可能一兩天都搞不定。更何況 R 需要編程,且前期的學習曲線會比較陡。

為了讓大家有一個形象的認識,我試圖用 R 來模擬 2017 年 Tableu 上海站冠軍 Young Lin 的比賽作品,大家可以點擊這裡查看。結論也顯而易見,Tableau 在作圖配色、字體、交互性、作圖速度方面吊打 R

說完了優點,咱們再來說說缺點。

Tableua 內置了常見的圖表模型,如果你的問題正好可以使用這些模型來展現的話,問題的處理會非常方便。但是一旦落在範圍之外的話,處理起來會非常麻煩,甚至不可能。這裡我來舉一個近期處理的問題:為了了解不同人的項目進度(實際進度是否達到了計划進度),我想通過可視化來展現,其中重要的需求如下:

  • 橫軸(x)代表計划進度,縱軸(y)代表實際進度,通過散點圖展示,每個點代表一個人
  • 加入一條 y = x 的輔助線,即實際進度剛好和計划進度一致。也就是說輔助線上方的人代表超出計划進度,下方的人代表落後計划進度
  • 圖表具有交互特性,滑鼠移到每個點會彈出信息框,包括計划進度、實際進度和其它信息

由於圖表的類型比較基礎,且需要交互特性,因此我首選的是 Tableau 。但是在作圖的過程中我發現原本在 R 中非常方便的細節在 Tableau 中實現起來比較麻煩。以下數據均已脫敏。

首先在我的數據中存在大量的重合點(計划進度相同,實際進度也相同),因此在 Tableau 中這些點被完全重合,很難直觀的分辨。

在 R 中,只需一行代碼即可增加水平和垂直方向的擾動:

geom_jitter(width = 0.2, height = 0.2)

但在 Tableau 中沒有相關的功能,因此我只能通過增加計算變數(生成額外的變數)來手動模擬:

[Secheduled_jitter_tableau] = [Secheduled] + (RANDOM() - 0.5) / 3
[actual_jitter_tableau] = [actual] + (RANDOM() - 0.5) / 3

通過 (RANDOM()-0.5) / 3 函數來隨機生成 -0.17 ~ 0.17 之間的數加在原來的數據上。其中 RANDOM() 代表 0~1的範圍,RANDOM() - 0.5 代表 -0.5 ~ 0.5 的範圍。

增加計算變數之後,基於新的數據來作圖:

雖然在這個過程中我們新增了兩個額外的變數,但至少近似達到了我們的預期。

接下去我們來增加 y = x 的輔助線。

在 R 中依然可以一行代碼搞定:

geom_abline(slope = 1, intercept = 0)

斜率為 1 ,截距為0,非常直觀。

但在 Tableu 中該如何實現呢?很遺憾,Tableau 沒有現成的 y = x 輔助線,需要自己額外生成一組 y = x 的數據(自己動手,豐衣足食哈哈哈)。

[Reference_line] = [Secheduled_jitter_tableau]

在這裡通過將新的變數 Reference_line 等於 Secheduled_jitter_tableau 來實現一組相等的數據,並在 Tableau 里設置雙坐標軸來將輔助線和散點圖重合。

相比之下,我們在 Tableau 里解決的擾動和輔助線問題更像是 hack ,並沒有像 R 中有原生的支持來得那麼自然。

總結

兩個工具各有千秋。如果你需要解決的問題更偏向商業分析,那麼 Tableau 可以幫助你更快速地做出動態交互圖,並且圖表和配色也非常拿得出手。如果你需要解決的問題需要更多的自定義,那麼 R 可能是更好的選擇。

Tableau:

  • 不需要寫代碼
  • 作圖飛快
  • 動態可交互
  • 配色、樣式美觀,給大老闆彙報也拿得出手

R:

  • 能力全面,可以完成數據分析的整個流程(從清洗到機器學習)
  • 支持 Markdown 和 Notebook,方便分析師間的交流
  • 插件量巨大,可解決的問題範圍非常廣。

1:引用自優達學城「數據分析(入門)」


今天剛看了一下tableau的官方視頻介紹,這段時間深入研究一下。

我對ggplot2有比較初步的了解,試著回答一下,對tableau有新了解以後再答。
---
個人感覺在數據比較clean,並且沒有太多需要計算和分析的情況下,tableau和r作圖能力差不多,應該是大部分作圖是都可以實現的。
從可視化的角度來講,我覺得tableau相當於是寫好代碼的模板,讓你很輕鬆的把很多功能一鍵解決,在r裡面,你可能就要寫代碼來做模板,調色,處理數據等。tableau更方便,更容易做出看上去專業美觀的圖。ggplot2則對數據處理和呈現更靈活,不過作圖效果有時和作圖人的審美也有關(曾經看網路教程學習的時候,看過一篇很好的做模板的介紹,同時也領略了真.直男程序員的審美)。


R主要是開源數據分析軟體,是專業級的統計分析軟體,同時由於開源性,可以掛在很多插件從而體現不同的圖形,但是前提是專業級的數據分析師。而tableau的優勢是靈活快捷,不需要什麼R語言,只要有數據就能做出圖形。這2個軟體關注的方向不同,一個更偏向於分析,一個偏向於展示。


謝邀。
這個真不會。
不好意思。


R的優勢就是開源。R是專業的統計分析軟體可以用別人或自己寫的package,tableau是一款商業軟體注重前端展示。功能上tableau怎麼也無法跟靈活的R抗衡,其實根本就沒有可比性。
打個比方,你說JAVA跟Photoshop這兩個東西怎麼比較誰更好呢。


Tableau作圖主要是簡單, 製作和修改都只要拖拽就行了。 還有很重要的一點是美觀, 同樣的圖表,看著比R和excel好看很多。

但是Tableau的圖表確實只能在已有模板上進行發揮。 所以比如sankey chart, network graph很難用。Tableau實現,還得靠R或者D3之類的。


最近都接觸過,作為想做數據挖掘的新手,想先碼一碼這兩者的體驗。

首先r是特別好用的一款語言,而且它是開源的,這就很能保證其質量和效用。下圖是我所使用的兩款編譯器,特別說明的是,r語言的編譯器也十分簡單,操作起來十分方便。

R語言就其本身來看,入手是非常簡單的。語法規則很容易懂。但是它更多的是面向於做數據挖掘的,而並非數據可視化,而且想要速成繪製出精美的圖形對於新手是十分困難的。

而tableau本身就是繪製圖形的一款優秀的軟體,導入數據十分方面,不用寫代碼,對於不是情懷狗(不糾結於正版還是盜版),免費還是付費其實是無所謂的。Tableau入手十分快,我用一天時間就可以利用地圖繪製出動圖,tableau裡面內嵌有地圖,這個和r是差不多的,但r地圖的精美度是比tableau要好很多的。

綜上,若是題主趕時間,tableau很適合,如果題主想要學數據挖掘,那應該選擇r語言。


一個軟體好不好用,強大不強大,對於不同使用者來說是不同的
當初為了更好的可視化作圖,試用了幾天,我的感覺,TAB的好處在於有一套現成的模板,你拿數據套模板就可以直接展示數據,更偏向於漂亮的展示數據,適合沒多少代碼基礎的人使用。不過模板也限制了靈活性,而這正是R的優點,比如多套數據疊加,重點顯示等等,用ggplot2就是加一層的事情,非常簡單方便。R的難點在於先得掌握編寫代碼的技巧,對於一些人可能學起來比較困難。還有一點,R是免費的,開源的,而T是收費的(別跟我說盜版)
另外,對於圖形展示,Excel其實很好用。除了本身基礎的作圖功能外,BI套件用來做商業、動態圖也很強大,使用Power_Query連接外部數據,Power_Pivot建立數據關係,Power_View和Power_Map用來作圖。對於做分析圖的人來說,Excel顯然更好上手


Tableau感覺挺弱的,限制比較多,不過適合初學者;

R要求高,適合高階選手


我用過ggplot2,作圖範圍是非常廣泛的,基本上想到的都能做到,而且免費,這是大優勢;如果考慮到數據分析方面的工作,R更值得花時間學習。
tableau是限制在它的模板裡面的,但好處是方便快捷,而且美觀,適合商業上使用,缺點就是收費,一年1000美元(雖然有免費public版本,但限制多多,例如不能保存)。


只能說R的作圖靈活度肯定比Tableau大


推薦閱讀:

相對於直接操作資料庫進行分析,hadoop和SPSS等數據分析軟體的作用是什麼?
數據可視化,大屏展示,哪家公司做的不錯?
哪些工具或網站可以分析亞馬遜全行業的數據?
矩陣的奇異值與特徵值有什麼相似之處與區別之處?
中國現在各行業的發展情況如何?

TAG:數據分析 | 數據可視化 | R編程語言 | TABLEAU | ggplot |