數據可視化的軟體,個人使用的,求推薦,最好多說幾個,多多益善?


分享幾個工具,不只是可視化方面的,還有數據挖掘、數據分析方面的工具,下面介紹了各個工具的具體使用方法、經典案例等資料。這些工具都十分直接易用,而且均為免費資源,並且沒有技術要求,尤其適合初學者。

數據挖掘工具

1. http://Import.io

一句話介紹:http://Import.io自動識別網頁結構,抓取內容,並轉化成表格供使用者下載,不要求使用者寫任何代碼,最適合用於內容量大,並且內容格式統一的網站,產品展示網頁是一個典型例子。同類型工具有Kimono。


最近跟朋友討論東南亞的電商市場,提到有「亞洲亞馬遜」之稱的Lazada。這家電商已經橫掃包括新加坡、泰國和印尼等東南亞新興市場,亦有人將之視為中國品牌登陸東南亞市場的最佳平台。既然耳聞這現象,不如就統計一下有多少部中國品牌手機已經進駐這個網站。

商品資料排得方方正正,雖然適合展示,卻不適用於數據分析,需要用http://Import.io將內容導成表格。

http://Import.io自動識別網頁的結構,並將內容轉化成表格,同類型內容會自動歸類排列,如http://Import.io抓取了不需要的資料,可以將之刪除。 把表格導入MicrosoftExcel,進行更進一步的數據清洗與分析。


案例:
WhatMusic Matters Most to KEXP

美國西雅圖的地區廣播電台KEXP,在其官方網站上提供一個實時更新的播放列表,將電台自所播放過的音樂都記錄下來。數據分析家兼音樂愛好者Jewel Loree統計了2013年KEXP所有播放過的音樂。她用http://Import.io抓取了網站的數據,利用Tableau(將於下一部分對此作介紹)製作成可視化圖表,並以不同角度作分析,例如統計不同時期,電台的音樂總播放率。

按星期統計的電台音樂播放率,可以看到有些日子的音樂播放次數特別少。


2. Cometdocs
一句話介紹:Cometdocs將PDF文檔轉換成MicrosoftWord, Excel, PowerPoint等格式文檔。同類型工具有:Cloudconvert。


許多機構發表公開報告時,都會選擇以PDF文檔形式發布,以確保文檔內容與格式,在不同的設備和平台上都能夠忠實再呈現,杜絕內容缺失、格式錯位等情況。以PDF文檔發表資料顯得正式,也符合讀者的閱讀習慣,但PDF文檔卻不太支持數據分析,拷貝表格到其他程序常錯格式,逐字敲打又費時失事。當記者收到PDF格式的數據表格時,可使用Cometdocs將表格轉成Excel或其他格式的文檔,方便分析。

以上是2014年全球各國的人類發展指數,刊載於同年的人類發展報告,報告以PDF格式發布。

Cometdocs能將PDF文檔轉成不同格式的文檔,如MicrosoftWord、Microsoft Excel、Microsoft PowerPoint等。


3. Wayback Machine

一句話介紹:WaybackMachine提供網站歷史備份查詢服務,適合用於需要長期追蹤的調查報道。


之前的文章提到,任何人或機構只要上網,都必定留下「網上足印」,Wayback Machine能幫你翻出這些腳印。這個工具自1996年起,定期訪問全球網站,抓取信息,收錄並備份,不過它不保證能把網站每一個版本全部抓取。

只要將網址輸進Wayback Machine,就能查看網頁的備份歷史備份。

數據可視化工具

4. Batchgeo

一句話介紹:Batchgeo能批量標註地圖位置標記,最適合用於分析和呈現具有區域特徵的數據。同類型工具有:地圖匯。

地圖可視化是數據可視化的重要分支,此項技術將不同區域或地點的數據,標註在地圖上,旨在讓讀者更容易明白數據在不同地域中的分布和規律。地圖可視化尤其適合用於對地區社會問題的研究和報道,例如貧窮與社會保障網路的分布,基礎設施在富人區是否更完善等。大家都會關心,自己生活的地方附近,醫療設施是否完善,想查證的話,可以運用Batchgeo,批量把城市的公共醫院、診所在地圖上標註出來,再作分析。

把公共醫院的地址(先用其中4家醫院舉例),根據Batchgeo給的格式,製作成Excel表格。Batchgeo調用Google Map,批量標註地點。記者得出地圖後,可以加入其他參數,如各地區的平均收入、平均年齡等,深入探討一個城市的醫療網路。


案例:
SexOffender Data by ZIP Code
美國新聞網站Detroit Free Press利用Batchgeo,將密歇根州的性犯罪者分布,製作成數據新聞。密歇根州法律要求警方公開性犯罪者名冊,市民可在名冊網站,輸入地址,查看附近社區的性犯罪者的資料。報道中,記者查考該州份的性犯罪者名冊,並按社區人口,計算出每1000人口中,性犯罪者(服刑中的性犯罪者除外)的數字,批量標註在地圖上。

5. Tableau

一句話介紹:Tableau支持快速海量數據分析,可視化圖表製作和共享。同類型工具有:Silk、http://Plot.ly。


Tableau簡單易用,十分適合初學者。它的另外一個優點是,國內有公司專門代理,並提供中文版,而且網上有許多討論群組和資源分享,要搜尋教學資料和案例,絕無難度。Tableau能接入多種、多項數據源,圖表的選擇亦非常豐富,自由度高,記者可靈活根據數據特徵制定可視化圖標。Tableau在國內有收費版,亦提供免費版Tableau Public,惟免費版用戶無法在電腦本地保存圖表,接入數據源的類型和大小都亦有所限制。

Tableau界面簡單,容易操作。

案例:
Metro Vancouver Commuting Pattern
除了之前介紹過的WhatMusic Matters Most to KEXP外,在這個數據新聞案例中,加拿大新聞網站Vancouver Sun收集了大溫哥華地區里居民的通勤數據,在Tableau中進行處理,並製作成可視化圖表。

讀者可選擇城市,並查看當地市民的通勤目的地與人次。

以上工具均簡單易用,並且免費,在資金和時間都緊缺的新聞編輯室里,絕對是記者的好幫手;亦是新手了解數據結構和可視化呈現的入門法寶。


文章原刊載於數據新聞網(http://djchina.org)。

作者陳嘉慧為財新數據可視化實驗室助理。

請關注微信公眾號:「財新數據可視化實驗室」或「caixinvislab」

更多資料:財新數據可視化實驗室 博客


安利一個今天剛發現來自微軟 Visualization and Interaction Team (VIBE) 的數據可視化軟體-SandDance(寓意像沙子的舞蹈)SandDance,確實也做到了,可謂眼前一亮,很有意思的是它初始的資料庫的例子中有一個是關於泰坦尼克號的,比如男女比例、票價的區間、全部船員的職業、死亡人數等等,配合數據可視化和電影,腦補當時泰坦尼克號的場景,還真是震撼,先上圖吧:

上圖就是各個級別的艙位的生存死亡情況,可以看出還是富人死的少,窮人死的多啊。。。
然後它有一個功能很實用,就是數據跟蹤,當你在一個種類的圖表中選中標註數據後,轉換至另外一個類型的圖表後,這些數據仍然不會消失,這就讓分析起圖表變得更簡單些;上圖吧:

選中後,圖表的元素也會相應變色,然後很帥的時刻來了:

在由Density的圖錶轉化為3D堆棧圖後,原來標記的數據仍然顯示,並且圖表的動畫很cool,真的像是沙子在跳舞,就像超能陸戰隊裡面大白的主人控制那些粒子一樣;
這突然讓我覺得動畫對於數據圖表還是很有意義的,雖然很多圖表的動畫都是毫無意義,畫蛇添足,但SandDance的動畫確實加強了其本身數據的表現力,很positive;
圖表動畫一定符合當前數據的類型,該是什麼就是什麼,不然動畫真的百害無一利;

怎麼樣,這樣看起來更帥吧,數據多了真的挺美的

上面是泰坦尼克號上乘客的職業分布,還真是震撼

雖然SandDance主要以視覺化的展示為主,並不像Tableau, PowerBI, SAP Lumira這種功能更加全面,擴展性更強的軟體,但它起碼走出了一條正確的道路,可視化中至少將「視」發揮的淋漓盡致,然後在配合微軟自家的PowerBI,今後的發展令人期待。
同時它也支持觸屏操作,更加適合在大場合進行數據可視化展示,再加上不錯的動畫,在大屏幕前觀看應該會高潮。。。

(圖片截取於https://www.youtube.com/watch?time_continue=59v=w5Jx6SSYyDo)
這樣自己也能製作像QQ在線人數那樣的可視化界面,cool~


好的可視化圖表不僅要美觀酷炫,還有直觀展示數據,及時發現數據背後的含義,幾十種常見的圖表見下方!除了柱狀圖、條形圖、折線圖、餅圖等常用圖表之外,還有數據地圖(熱力圖、軌跡圖等)、人口金字塔、矩形樹圖、瀑布圖和散點圖,旭日圖,漏斗圖等酷炫圖表,一起了解下不同圖表的使用場景、優劣勢!這些數據可視化圖表均來自bdp(http://me.bdp.cn),拖拽即生成圖表~~

  1.柱狀圖

  適用場景:適用場合是二維數據集(每個數據點包括兩個值x和y),但只有一個維度需要比較,用於顯示一段時間內的數據變化或顯示各項之間的比較情況。適用於枚舉的數據,比如地域之間的關係,數據沒有必然的連續性。

  優勢:柱狀圖利用柱子的高度,反映數據的差異,肉眼對高度差異很敏感。

  劣勢:柱狀圖的局限在於只適用中小規模的數據集。

  延伸圖表:堆積柱狀圖、百分比堆積柱狀圖

  不僅可以直觀的看出每個系列的值,還能夠反映出系列的總和,尤其是當需要看某一單位的綜合以及各系列值的比重時,最適合。

  (堆積柱狀圖)


  2.條形圖

  適用場景:顯示各個項目之間的比較情況,和柱狀圖類似的作用。

  優勢:每個條都清晰表示數據,直觀。

 延伸圖表:堆積條形圖、百分比堆積條形圖

  (堆積條形圖)

  3.折線圖

  適用場景: 折線圖適合二維的大數據集,還適合多個二維數據集的比較。一般用來表示趨勢的變化,橫軸一般為日期欄位。

  優勢:容易反應出數據變化的趨勢。

  4.各種酷炫的數據地圖(一共有7種類型,最喜歡BDP的地圖了,尤其是動態軌跡圖,製作人口遷徙圖很方便~)

  適用場景:適用於有空間位置的數據集,一般分成行政地圖(氣泡圖、面積圖)和GIS地圖(包括熱力圖、軌跡圖等)。行政地圖一般有省份、城市數據就夠了(比如福建-泉州);而GIS地圖則需要經緯度數據,更細化到具體區域,只要有數據,可做區域、全國甚至全球的地圖,支持百度地圖、騰訊地圖等。

  優劣勢:特殊狀況下使用,涉及行政區域。

  (1)行政地圖(面積圖):以顏色深淺來展示數據的大小!

  (2)行政地圖(氣泡圖)

  (3)GIS地圖:海量點

  (4)GIS地圖:熱力圖(分別為全國熱力圖和上海區域熱力圖)

  (5)GIS地圖:(北京某區域)散點圖

  (6)GIS地圖:地圖+柱狀/餅圖/條形

  (7)GIS地圖:軌跡圖,人口遷徙動態變化效果:https://me.bdp.cn/share/index.html?shareId=sdo_6b712c6cfd905db62b2c02c49e731f34

  5.餅圖(環圖)

  適用場景:顯示各項的大小與各項總和的比例。適用簡單的佔比比例圖,在不要求數據精細的情況適用。

  優勢:明確顯示數據的比例情況,尤其合適渠道來源等場景。

  劣勢:不會具體的數值,只是整體的佔比情況。

  餅圖、環圖你喜歡那個呢,可以直接設置~

  6.雷達圖

  適用場景:雷達圖適用於多維數據(四維以上),一般是用來表示某個數據欄位的綜合情況,數據點一般6個左右,太多的話辨別起來有困難。

  優勢:主要用來了解公司各項數據指標的變動情形及其好壞趨向。

  劣勢:理解成本較高。

  7.漏斗圖

  適用場景:漏斗圖適用於業務流程多的流程分析,顯示各流程的轉化率

  優勢:在網站分析中,通常用於轉化率比較,它不僅能展示用戶從進入網站到實現購買的最終轉化率,還可以展示每個步驟的轉化率,能夠直觀地發現和說明問題所在。

  劣勢:單一漏斗圖無法評價網站某個關鍵流程中各步驟轉化率的好壞。

  8.詞雲

  適用場景: 顯示詞頻,可以用來做一些用戶畫像、用戶標籤的工作。

  優勢:很酷炫、很直觀的圖表。劣勢:使用場景單一,一般用來做詞頻。

  9.散點圖

  適用場景:顯示若干數據系列中各數值之間的關係,類似XY軸,判斷兩變數之間是否存在某種關聯。散點圖適用於三維數據集,但其中只有兩維數據是需要比較的。另外,散點圖還可以看出極值的分布情況。

  優勢:對於處理值的分布和數據點的分簇區域(通過設置橫縱項的輔助線),散點圖都很理想。如果數據集中包含非常多的點,那麼散點圖便是最佳圖表類型。

  劣勢:在點狀圖中顯示多個序列看上去非常混亂。

  10.面積圖

  適用場景:強調數量隨時間而變化的程度,也可用於引起人們對總值趨勢的注意。

  延伸圖表:堆積面積圖、百分比堆積面積圖還可以顯示部分與整體之間(或者幾個數據變數之間)的關係。

  11.指標卡

  適用場景:顯示某個數據結果同環比數據。

  優勢:適用場景很多,很直觀告訴看圖者數據的最終結果,一般是昨天、上周等,還可以看不同時間維度的同環比情況。

  劣勢:只是單一的數據展示,最多有同環比,但是不能對比其他數據。

  12.計量圖

  適用場景:一般用來顯示項目的完成進度。

  優勢:很直觀展示項目的進度情況,類似於進度條。

  劣勢:表達效果很明確,數據場景比較單一。

  13.瀑布圖

  適用場景:採用絕對值與相對值結合的方式,適用於表達數個特定數值之間的數量變化關係,最終展示一個累計值。

  優勢:展示兩個數據點之間的演變過程,還可以展示數據是如何累計的。

  14.桑基圖

  適用場景:一種特定類型的流程圖,始末端的分支寬度總各相等,一個數據從始至終的流程很清晰,圖中延伸的分支的寬度對應數據流量的大小流量隨著時間推移變化的情況,通常應用於能源、材料成分、金融等數據的可視化分析。參考桑基圖 |簡單粗暴,年末就要「囤」技能!

  15.旭日圖

  適用場景:旭日圖可以表達清晰的層級和歸屬關係,以父子層次結構來顯示數據構成情況,旭日圖能便於細分溯源分析數據,通過分層佔比情況真正了解數據的具體構成。

  優勢:分層看數據很直觀,逐層下鑽看數據。

  16.矩形樹圖

  適用場景:類似於旭日圖,兩者區別可參考矩形樹圖 | 開工啦,10秒就能學會新年第1個「雞」能哦!

  17.對比條形圖(人口金字塔)

  適用場景:在對多列數據進行對比時,而且數據標籤比較長的話,一般會採用條形圖做對比。

  18.雙軸圖

  適用場景:柱狀圖+折線圖的結合,適用情況很多,比如數量級相差很大的情況、數據同環比分析對比等情況都能適用。

  優勢:特別通用,屬於不同圖表的組合使用,比如柱狀圖+折線圖的結合,圖表很直觀。

  劣勢:這個好像沒什麼劣勢,個人感覺。

當然,當你分析數據的時候一定不會只用一種圖表,尤其是數據報告中,都會用到多個圖表,如下圖~

下面是深色背景(星空藍)下的圖表效果:

這些可視化圖表均來自數據可視化軟體BDP個人版!


數據可視化軟體,個人使用的話,我極力極力極力推薦的就是[數據觀]。

為什麼呢,因為工作原因,我試用過很多很多這方面的產品。

從Gartner魔力象限裡頭的領導者Tableau、Qliksense,到國內名聲比較響的帆軟、永洪bi。

估計得有快10個?

能讓我5分鐘之內就上傳好數據、根據需求處理一下、並且做成圖表的,就數據觀一個。

產品設計得太友好了!太容易上手了!

——————————————————————————————————

忍不住想舉個 。

上周我們銷售總監說,你們看友商的公眾號了嗎?寫的比咱們好啊!你們行不行啊?能不能給點力啊??

我心想:有這事兒?丟臉丟大了?連忙點開友商公眾號,看了一個月的文章,結果發現,從選題到閱讀量,好像……都沒有我們好啊???這難道是銷售拉不到單,要我們背鍋哇??

作為具有部門自豪感的人員,當然不能忍辣!

說好的市場部跟銷售團隊一起並肩作戰呢?

說好的我給你們提供內容支持你給我們把錢錢拿回來呢?

還能不能同心協力服務客戶辣?

但是,直接懟回去,就把我們部門逼格拉低了。

對付別人的主觀感受,最有力的武器,就是客觀事實。

於是決定,用數據說話!

於是,就有了這樣一個板子:

——————————————————————————————————

上面一溜用的是KPI圖,主要是告訴他幾個重要指標(我們的成績)

1、自從公眾號啟動之後,我們總共發出了7篇文章;

2、這七篇文章,圖文頁閱讀次數是5252次,平均每篇文章750多(友商的可以進去拖到末尾看,每篇100~200左右);

3、文章一共被分享、轉發了436次,平均每篇獲得62次左右;

4、文章一共被收藏了105次,平均每篇文章獲得收藏15次左右。

下面的柱圖,是七篇文章的圖文閱讀數量,其中黃色柱子代表圖文閱讀人數,藍色柱子代表圖文閱讀次數。跟上面的KPI也算做一個互證,點進去還可以看到具體明細,省得你說我編數據騙你!

然後是微信收藏數量,和分享轉發次數這倆柱圖,同樣,黃色代表按人算,藍色按次數算,排列的順序是,按照人的降序來,這樣這個板子對我們市場部的工作也有指導意義,可以看出來,什麼樣的文章更受讀者喜歡;

最後倆KPI,展示的是公眾號啟動之後,最新的粉絲數量是多少,以及這幾天凈增了多少。當然,這個數字還沒有達到我的理想狀態,所以被我隱藏辣!

——————————————————————————————————

拿著這塊板子,我溫柔滴把它投在了公司會議室(開放式)的電視上,給我們銷售大大演示了一下。

銷售大大的表情比較精彩,我現在都還在回味。

——————————————————————————————————

——————————————————————————————————

其實,同一個公司的不同部門、甚至同一個部門不同人員之間,所認識到的事實,並不是統一的事實。

一個公司,尤其是初創公司,想要發展,除了把產品做好之外,就是要讓公司全員上下一條心,在同一個事實下,用同一套語言說話。

這時候,數據雖然可能不是最完美的,但往往是最容易依靠、也是最可靠的。

所以,就算我們不響應馬爸爸的號召,還是會進入DT時代。

有一樣思路的小夥伴嗎?我們握個手吧!

——————————————————————————————————

那麼,DT時代,什麼樣的數據處理工具最靠譜?結合Gartner的報告,還有市面上一些產品試用,我認為必須要有如下幾點:

1、一站式:就是從數據的搜集,到最後的彙報,都能用同一個軟體或是在同一個平台上完成,並且要有流程感,不可以彼此孤立。要跟著工具流暢地行走,而不是進入工具像進入迷宮一樣。

2、自服務:數據的許可權以及處理都不能再卡在所謂的IT部門了,每個人都應該主宰自己相關的數據,並且有能力讓這部分數據為自己所用。自服務地連接,不用寫sql文就能調取、查看自己想看的指標;自服務地處理數據,自服務地可視化成為各種各樣的圖表,並且根據分析思路來編排。

3、協作:在產品/平台裡面,在每一張圖表當中,都應該可以和相關的人聊天,或者你叫溝通也行!只要你分享了許可權,你的夥伴也可以在你的看板上過濾,下鑽,優化看板,添加標籤等等~~~打破數據孤島的下一步,就是打破工作孤島。唯有基於數據協作,才有可能達成企業共識,把工作變成合作~


最後我還想說,數據分析的門檻降低了,並不說明數據分析不牛逼了,而是說,因為有了科技的發展,我們才得以在數據面前不做個傻子。希望我們每個人都能跟數據對話。


為了讓開發者更好地使用數據可視化工具,雲棲社區組織翻譯了GitHub上的 Awesome dataviz ,其幾乎囊括了優秀的數據可視化框架,庫和軟體。涵蓋了支持JavaScript,Android,C++,Golang,iOS,Python,R語言和Ruby等編程語言的數據可視化工具,精彩不容錯過。

內容目錄

  • Awesome dataviz
    • JavaScript 工具
      • 圖表庫
      • 圖形圖表庫
      • 地圖(Maps)
      • d3
      • dc.js
      • Misc
    • Android 工具
    • C++ 工具
    • Golang 工具
    • iOS 工具
    • Python 工具
    • R 工具
    • Ruby 工具
    • 其他工具
  • 資源
    • 參考書籍
    • 資源網站

JavaScript 工具集

圖表庫

  • C3 - 以 d3 為基礎構建的可重用圖表庫
  • Chart.js - 帶有 canvas 標籤的圖表
  • Chartist.js - 具有強大瀏覽器兼容能力的響應式圖表
  • Dimple - 適用於業務分析的面向對象的 API
  • Dygraphs - 適用於大型數據集的互動式線性圖表庫
  • Echarts - 針對大型數據集的高度定製化互動式圖表
  • Epoch - 可以完美創建的即時圖表
  • Highcharts - 基於SVG和VML呈現的圖表庫. 免費 (CC BY-NC 可用於非盈利項目)
  • MetricsGraphics.js - 能夠針對時間序列數據進行優化
  • Morris.js - 非常漂亮的時間序列線狀圖
  • NVD3 - 使用 d3.js 實現的可重用性圖表庫
  • Peity - 可創建小型內連 svg 圖表
  • Plotly.js - 支持20種圖表類型的強大的聲明式庫
  • TechanJS - 股票以及金融圖表

圖形(graphs)圖表庫

  • Cola.js - 通過基於約束的優化技術創建圖表的工具. 和 d3 以及 svg.js 共同發揮作用
  • Cytoscape.js - 由 Cytoscape 核心開發人員維護的用於繪製圖形的 JavaScript 庫.
  • Linkurious - 一款基於 Sigma.js 的能加快圖形可視化和互動式應用的開發速度的工具箱
  • Sigma.js - 致力於圖形繪製的 JavaScript 庫
  • VivaGraph - 針對 JavaScript 的圖形繪製庫

地圖(Maps)

  • CartoDB - CartoDB 是一款開源工具並且其允許對網頁上的地理數據進行存儲和可視化
  • Cesium - WebGL 虛擬地球儀和地圖引擎
  • Leaflet - 對移動端友好的互動式地圖JavaScript 庫
  • Leaflet Data Visualization Framework - 使用了 Leaflet 的設計用於簡化數據可視化和主題映射的框架
  • Mapael - 基於 the.js 的能夠展示矢量地圖的 jQuery 插件
  • Mapsense.js - 將 d3.js 和瓷磚式覆蓋地圖結合起來
  • Modest Maps - 使用 Javascript,依照 BSD 許可的瓷磚覆蓋式為基礎展示和交互地圖庫

d3

  • 參見 Awesome D3

dc.js

dc.js 是一個多維圖表構建工具,其能夠與 crossfilter 完美地配合工作

  • angular-dc - dc.js 的 AngularJS 指令
  • dc.leaflet.js - 使用了 Leaflet 地圖的 dc.js 圖表
  • ember-dc - dc.js 的 Ember Component Wrappers(組件包裝)

雜項

  • Chroma.js - 用於處理色彩的小型庫文件
  • Piecon - 圖標上的餅狀圖繪製工具
  • Recline.js - 使用純 JavaScript 和 HTML 的用於構建數據應用的簡單而又強大的庫
  • Textures.js - 用於創建 SVG 模式的庫
  • Timeline.js - 創建互動式時間線
  • Vega - Vega 是一個用於創建,保存和分享互動式可視化數據設計的語法和格式
  • Vis.js - 一個包括了時間線,網路和圖表(2D和3D)的動態可視化庫

安卓工具

  • HelloCharts - 兼容安卓 API 8及以上版本的圖表庫
  • MPAndroidChart - 一款功能強大而又易於使用的圖表庫

C++工具

  • Visualization Toolkit (VTK) - 用於3D圖形和圖像處理和可視化的開源庫

Go語言工具

  • Charts for Go - 基於 Go 的基礎圖表. 其能夠對 ASCII、 SVG 和 圖像進行渲染
  • svgo - 針對 SVG 的 Go 語言庫

iOS工具

  • JBChartView - 同時支持線性和條形圖的圖表庫
  • PNChart - 使用了 Piner 和 CoinsMan 的簡單並且美麗的圖表
  • ios-charts - MPAndroidChar 的 iOS 埠. 其可以使用非常簡單的代碼為兩個平台創建圖表

Python工具

  • bokeh - 用於 Python 的互動式網頁繪圖工具
  • ggplot - 與ggplot2 面向R語言的 API相同
  • glumpy - OpenGL 科學可視化庫
  • matplotlib - 2D 繪圖庫
  • pygal - 一個動態 SVG 圖表庫
  • PyQtGraph - 互動式和實時的 2D/3D/圖像 繪製以及科學/工程工具
  • seaborn - 一個能夠製作極具吸引力的和展現翔實統計信息數據的圖表庫
  • toyplot - 目標為大型數據圖表的小型 Python 數據圖表繪製工具
  • Vincent - 面向 Vega 翻譯器的 Python 工具
  • VisPy - 基於 OpenGL 的高效科學可視化工具
  • mpld3 - Matplotlib Graphics的 D3 渲染工具

R工具

  • ggplot2 - 一個基於圖形語法的繪圖系統
  • lattice - R語言格子圖形
  • plotly - 互動式圖表(向 ggplot2 的輸出中添加了交互性), 統計圖和簡單網路圖
  • rbokeh - 針對 Bokeh 的R語言介面
  • rgl - 使用了 OpenGL 的3D 可視化
  • shiny - 用於創建互動式應用和可視化的框架
  • visNetwork - 互動式網路可視化

Ruby工具

  • Chartkick - 使用 Ruby 的單線創建圖表的工具

其他工具

不與特定平台或語言綁定的工具

  • Charted - 一個能夠從任何數據文件中創建自動化,可分享的圖表的工具
  • Gephi - 一個用於可視化和製作大型圖表的開源平台
  • Lightning - 一個提供以API為基礎的方式獲取可再生,網路為基礎的互動式可視化圖表的數據可視化服務
  • RAW - 由 CSV 和 Excel 文件創建的網路可視化工具
  • Spark - 命令解釋程序(shell)走勢圖. 其包含多種實現語言
  • Periscope - 直接由SQL查詢語句創建圖表

參考書籍

  • Design for Information 作者: Isabel Meirelles
  • The Best American Infographics 2014 作者: Gareth Cook
  • The Visual Display of Quantitative Information 作者: Edward Tufte
  • The Wall Street Journal Guide to Information Graphics 作者: Dona M. Wong
  • Visualization Analysis and Design 作者: Tamara Munzner

資源網站

  • FlowingData
  • Information is Beautiful
  • The Data Visualization Catalogue - 一個數據可視化工具的集合,優缺點兼具
  • Visual Complexity - 關於複雜網路可視化的網站

原文鏈接:Awesome dataviz GitHub

譯者:賈子甲 校對:劉崇鑫 王殿進

如果發現原文翻譯有誤,請郵件通知雲棲社區(yqeditor@list.alibaba-inc.com),感謝您的支持。


數據觀


  1. Datamatic.io
  2. ECharts · Example
  3. Lucidchart | Diagrams Done Right
  4. Excel

---------------------------------------------------------------
順手看了一下其他同話題下的其他問題。
有哪些值得推薦的數據可視化工具? - 商業
---------------------------------------------------------------
你確定你搜了?
你確定你看了別人的答案?
你確定你是認真的?


大家似乎都覺得在專業圖表製作過程中,軟體的選擇極為重要。在「知乎」上曾看到一個關於科學專業圖表製作軟體的帖子,當有人問到用哪款軟體能畫出漂亮的專業圖表時,網友們都給出了自己的答案:如何在論文中畫出漂亮的插圖? - 科研。

總的來說,在科學圖表的製作方面,Python、Matlab或Mathematica、R語言是比較主流的應用軟體。你可能只看關於這四款軟體的文字描述,沒什麼視覺上的差異。下面我使用相同的數據,分別應用Python,Matlab和R語言繪製散點圖,圖像效果如圖1.2.1所示。

圖1.2.1(a) 是在Python語言matplotlib中使用半透明的配色,顯示出高手1所說的那高貴冷艷的風格。Python為了進一步提升自己的繪圖能力,還開發了Prettyplotlib和Seaborn兩個繪圖包。Seaborn的繪圖風格和R語言的ggplot2很類似。
圖1.2.1(b) 是使用Matlab 2013a經調整和修飾展現的散點圖,效果還不錯。Matlab 2014b 推出了全新的Matlab圖形系統。全新的默認顏色、字體和樣式便於數據解釋。被大家吐槽的線條鋸齒的醜陋默認配色也都已經改進,抗鋸齒字體和線條使文字和圖形看起來更平滑。
圖1.2.1(c) 是使用R語言ggplot2包繪製的散點圖,灰色背景和白色網格線的搭配給人清新亮麗的感覺。ggplot2包的開發者還開發了繪圖效果類似的gcookbook包。但是也如高手3所說,R語言並不能很好地展示三維立體圖,這也是它最大的缺陷。

但是不管這三款繪圖效果到底如何,這三款軟體一個共有的特點就是它們需要編程才能實現繪圖功能,對於大部分沒有編程基礎的學生來說,這是一個很大的繪圖障礙。然而,你不需要擔心,因為有一款不需要編程基礎就能實現這些軟體的繪圖效果,它就是眾所周知的Excel。

使用Excel 2016模仿圖1.2.1繪製的散點圖,如圖1.2.2所示。Excel繪圖效果是不是幾乎跟這三款軟體展示的效果一樣?在繪製二維圖像方面,我覺得Excel是當之無愧的劍中之屠龍寶刀,它不僅能繪製出各種軟體所展示的圖像效果,也能自由控制所有的圖表元素。

Excel、Python、Matlab或Mathematica、R、Tableau、D3.js 是數據可視化領域中十分優秀的圖表製作軟體。Excel繪製科學圖表的方法與配色可借鑒這幾款軟體。Python、R、Tableau和D3.js的圖表風格和配色效果各有各的特點,都是值得深入學習並應用到Excel科學圖表的繪製中。

Tableau 是桌面系統中最簡單的商業智能工具軟體,Tableau 沒有強迫用戶編寫自定義代碼,新的控制台也可完全自定義配置,是一款功能超級好用、效果超級美觀的商業圖表繪製軟體,但它是一款商業軟體,需要付費才能使用,而且主要應用於商業數據的分析與圖表製作。

D3.js是最流行的可視化庫之一。D3幫助你給數據帶來活力通過使用HTML、SVG和CSS,D3重視Web標準為你提供現代瀏覽器的全部功能。D3.js是一款專業級的數據可視化操作編程庫,是基於數據操作文檔JavaScript庫。所以它也需要編程才能實現,而且編程比Matlab、R和Python更複雜。

使用D3.js的d3.layout.cloud.js繪製數據可視化軟體的標籤雲(Tag Cloud),如圖1.2.3所示。不知道你認識或熟悉的數據可視化軟體有幾款,但這些並不重要,只要你會使用Excel就足以解決一維和二維數據的可視化。

另外,我們來看看不同軟體繪製的效果圖,包括常見的Origin、Sigmaplot、GraphPad、Matlab、Python。

最後,我想說,有一款平凡的軟體能繪製這些軟體圖像的效果,但又不需要編程基礎就能實現,它就是眾所周知的 Excel。Excel才是王道!使用Excel仿製的Python、Matlab、R繪製的散點效果圖,幾乎沒有差異。

EasyCharts團隊出品

帥的人都關注了EasyCharts團隊^..^~

QQ交流群:454614789

微信公眾號:EasyCharts

更多信息敬請查看: http://easychart.github.io/post/Easycharts/


根據個人經驗和不同的使用目的回答一下:

科研目的:最常用是Matlab,好處是處理靈活,功能強大。缺點是在企業中應用較少,圖比較丑。。。

統計建模用:

  1. R語言。好處是ggplot2等R包專門為可視化開發的包。優點是貌美,並且封裝得好,直接調用即可,在程序語言中屬於相當容易上手的。缺點是R是基於內存處理方式,並且對數據的處理原理是全部讀取之後,再一起處理,所以對內存的需求很大,本地處理上G的數據的話,一不小心就崩潰了。。。。
  2. Python。好處是靈活,數據處理能力非常強,編程語言中做數據模/機器學習非常友善工具。缺點是可視化不是很貌美。。。統計方面包沒有R那麼多。

BI/數據監控/業務分析用:

  1. 付費SAAS軟體GrowingIO,數據採集/數據可視化/分析果的智能推薦,一站搞定。優點是貌美/方便/基於產品和業務,缺點是封裝比較嚴重,不是非常靈活。

2. 付費可視化工具Tableau。專註於做數據可視化好多年,功能非常強大,可以連接資料庫。優點是上手非常快,貌美。缺點是個人使用的話應該是買不起,可以去萬能的淘寶找破解版。

3. 除此之外,還有微軟PowerBI、Gephi等等,不一一介紹了~

大家有疑問的話,可以私聊繼續探討~


R里的ggplot2
Python的matplotlib
R和Python都可以的Plotly

這些導出pdf格式可以用AI調整最後效果。

想交互的話試試D3
Processing也不錯。

推薦本書,書名叫visualize this,中文好像叫鮮活的數據。及書的作者搞的網站,名叫flowingdata


Gephi


必須是Tableau 啊。http://www.rinterest.cn/course/index/10有更詳細的學習內容。你可以看看,我就是在這裡看到的,比較容易上手,製作過程也很快。


各位大神都介紹了很多國外的工具,包括像是Tableau 這種比較優秀的,可惜收費啊,我也試著用了下,比較繁瑣,後來在網上找了一個國內的,還算比較符合國情吧,拿出來跟大家分享下:
圖表秀 http://tubiaoxiu.com
這個我覺得有幾個點比較適合我,第一是免費 哈哈 第二是比較容易上手 適合我這種比較小白的新手,國外很多軟體用起來感覺麻煩,第三是這個工具可以將做好的圖 直接導出來到PPT或是形成一個HTML連接,保存到電腦里 隨時都可以給別人展示,也不用聯網了。


靜態圖片:R的ggplot2、python的seaborn

交互網站:Echarts、D3

視頻展示:processing

放一些我做的可視化案例吧:

SODA | 大規模人群的識別和疏散

魔鏡杯 | 數據產品分析可視化平台

數據 | 環境問題

知乎專欄

希望更多的人愛上數據可視化~

最後安利一下,我製作了一個「全棧數據工程師養成攻略」的系列視頻教程,持續更新中,對數據工程涉及到的相關內容做一個概覽,幫助大家快速入門、提升興趣。裡面也會涉及到使用R、Echarts、D3、Processing等進行可視化的內容,如果有興趣可以關注一下~

全棧數據工程師養成攻略 - 網易雲課堂


Gephi是一個全平台的互動式可視化平台,它特別適用於複雜的大數據可視化工作。下載實時可視化

  • Gephi使用的高速引擎可以快速迭代出你想要的圖像。
  • 超大網路,從5w節點到100w節點都可以支持。
  • 大量可用工具。

高效簡易的布局工具

對複雜圖進行布局是一個困難的問題,而Gephi提供了最簡易高效的布局演算法。軟體還支持在迭代的同時移動單個或是一片節點。你還可以在market中下載更多的plugin,其中也包括了來自不同開發者的其他布局演算法。

簡易教程歡迎訪問我的博客 可視化網路 Gephi


推薦plotly

它對Python、R、MATLAB及JS都提供了相應的API介面(每天可免費調用250次)。同時,plotly提供了豐富的可視化案例和模版,使用既有的框架,做好數據的清洗和整理,就能做出需要的圖形。

以下是我應用Python +plotly 對全球恐怖襲擊數據做的一些可視分析,具體的分析報告及動態版圖形見 知乎專欄。

具體的作圖代碼(Python版本)見:GitHub - bnuFisher/data_vis


視覺圖表: https://appsto.re/cn/y2c-ab.i
支持 iPhone 和 iPad

支持在 iMessage 中傳送圖表


1.excel;
2.BDP個人版(http://me.bdp.cn)

3.cartoDB(http://cartodb.com/)


DataHunter

Excel

PowerBI


可以試試smartbi,對小微用戶免費,包含儀錶盤,數據可視化,大屏展現,自助探索分析,最近在搞線上培訓,效果挺好的。


推薦閱讀:

哪些適合宿舍用的電腦椅 ?
如何將枯燥的大數據呈現為可視化的圖和動畫?
y=x^x 的图像大概是什么样的?

TAG:軟體 | 數據分析 | 數據可視化 | 可視化 | 大數據 |