數據可視化的軟體,個人使用的,求推薦,最好多說幾個,多多益善?
分享幾個工具,不只是可視化方面的,還有數據挖掘、數據分析方面的工具,下面介紹了各個工具的具體使用方法、經典案例等資料。這些工具都十分直接易用,而且均為免費資源,並且沒有技術要求,尤其適合初學者。
數據挖掘工具
1. http://Import.io
一句話介紹:http://Import.io自動識別網頁結構,抓取內容,並轉化成表格供使用者下載,不要求使用者寫任何代碼,最適合用於內容量大,並且內容格式統一的網站,產品展示網頁是一個典型例子。同類型工具有Kimono。
最近跟朋友討論東南亞的電商市場,提到有「亞洲亞馬遜」之稱的Lazada。這家電商已經橫掃包括新加坡、泰國和印尼等東南亞新興市場,亦有人將之視為中國品牌登陸東南亞市場的最佳平台。既然耳聞這現象,不如就統計一下有多少部中國品牌手機已經進駐這個網站。
商品資料排得方方正正,雖然適合展示,卻不適用於數據分析,需要用http://Import.io將內容導成表格。
http://Import.io自動識別網頁的結構,並將內容轉化成表格,同類型內容會自動歸類排列,如http://Import.io抓取了不需要的資料,可以將之刪除。 把表格導入MicrosoftExcel,進行更進一步的數據清洗與分析。
案例:
WhatMusic Matters Most to KEXP
美國西雅圖的地區廣播電台KEXP,在其官方網站上提供一個實時更新的播放列表,將電台自所播放過的音樂都記錄下來。數據分析家兼音樂愛好者Jewel Loree統計了2013年KEXP所有播放過的音樂。她用http://Import.io抓取了網站的數據,利用Tableau(將於下一部分對此作介紹)製作成可視化圖表,並以不同角度作分析,例如統計不同時期,電台的音樂總播放率。
按星期統計的電台音樂播放率,可以看到有些日子的音樂播放次數特別少。
2. Cometdocs
一句話介紹:Cometdocs將PDF文檔轉換成MicrosoftWord, Excel, PowerPoint等格式文檔。同類型工具有:Cloudconvert。
許多機構發表公開報告時,都會選擇以PDF文檔形式發布,以確保文檔內容與格式,在不同的設備和平台上都能夠忠實再呈現,杜絕內容缺失、格式錯位等情況。以PDF文檔發表資料顯得正式,也符合讀者的閱讀習慣,但PDF文檔卻不太支持數據分析,拷貝表格到其他程序常錯格式,逐字敲打又費時失事。當記者收到PDF格式的數據表格時,可使用Cometdocs將表格轉成Excel或其他格式的文檔,方便分析。
以上是2014年全球各國的人類發展指數,刊載於同年的人類發展報告,報告以PDF格式發布。
Cometdocs能將PDF文檔轉成不同格式的文檔,如MicrosoftWord、Microsoft Excel、Microsoft PowerPoint等。
3. Wayback Machine
一句話介紹:WaybackMachine提供網站歷史備份查詢服務,適合用於需要長期追蹤的調查報道。
之前的文章提到,任何人或機構只要上網,都必定留下「網上足印」,Wayback Machine能幫你翻出這些腳印。這個工具自1996年起,定期訪問全球網站,抓取信息,收錄並備份,不過它不保證能把網站每一個版本全部抓取。
只要將網址輸進Wayback Machine,就能查看網頁的備份歷史備份。
數據可視化工具
4. Batchgeo
一句話介紹:Batchgeo能批量標註地圖位置標記,最適合用於分析和呈現具有區域特徵的數據。同類型工具有:地圖匯。
地圖可視化是數據可視化的重要分支,此項技術將不同區域或地點的數據,標註在地圖上,旨在讓讀者更容易明白數據在不同地域中的分布和規律。地圖可視化尤其適合用於對地區社會問題的研究和報道,例如貧窮與社會保障網路的分布,基礎設施在富人區是否更完善等。大家都會關心,自己生活的地方附近,醫療設施是否完善,想查證的話,可以運用Batchgeo,批量把城市的公共醫院、診所在地圖上標註出來,再作分析。
把公共醫院的地址(先用其中4家醫院舉例),根據Batchgeo給的格式,製作成Excel表格。Batchgeo調用Google Map,批量標註地點。記者得出地圖後,可以加入其他參數,如各地區的平均收入、平均年齡等,深入探討一個城市的醫療網路。
案例:
SexOffender Data by ZIP Code
美國新聞網站Detroit Free Press利用Batchgeo,將密歇根州的性犯罪者分布,製作成數據新聞。密歇根州法律要求警方公開性犯罪者名冊,市民可在名冊網站,輸入地址,查看附近社區的性犯罪者的資料。報道中,記者查考該州份的性犯罪者名冊,並按社區人口,計算出每1000人口中,性犯罪者(服刑中的性犯罪者除外)的數字,批量標註在地圖上。
5. Tableau
一句話介紹:Tableau支持快速海量數據分析,可視化圖表製作和共享。同類型工具有:Silk、http://Plot.ly。
Tableau簡單易用,十分適合初學者。它的另外一個優點是,國內有公司專門代理,並提供中文版,而且網上有許多討論群組和資源分享,要搜尋教學資料和案例,絕無難度。Tableau能接入多種、多項數據源,圖表的選擇亦非常豐富,自由度高,記者可靈活根據數據特徵制定可視化圖標。Tableau在國內有收費版,亦提供免費版Tableau Public,惟免費版用戶無法在電腦本地保存圖表,接入數據源的類型和大小都亦有所限制。
Tableau界面簡單,容易操作。
案例:
Metro Vancouver Commuting Pattern
除了之前介紹過的WhatMusic Matters Most to KEXP外,在這個數據新聞案例中,加拿大新聞網站Vancouver Sun收集了大溫哥華地區里居民的通勤數據,在Tableau中進行處理,並製作成可視化圖表。
讀者可選擇城市,並查看當地市民的通勤目的地與人次。
以上工具均簡單易用,並且免費,在資金和時間都緊缺的新聞編輯室里,絕對是記者的好幫手;亦是新手了解數據結構和可視化呈現的入門法寶。
文章原刊載於數據新聞網(http://djchina.org)。
作者陳嘉慧為財新數據可視化實驗室助理。
請關注微信公眾號:「財新數據可視化實驗室」或「caixinvislab」
更多資料:財新數據可視化實驗室 博客
安利一個今天剛發現來自微軟 Visualization and Interaction Team (VIBE) 的數據可視化軟體-SandDance(寓意像沙子的舞蹈)SandDance,確實也做到了,可謂眼前一亮,很有意思的是它初始的資料庫的例子中有一個是關於泰坦尼克號的,比如男女比例、票價的區間、全部船員的職業、死亡人數等等,配合數據可視化和電影,腦補當時泰坦尼克號的場景,還真是震撼,先上圖吧:
上圖就是各個級別的艙位的生存死亡情況,可以看出還是富人死的少,窮人死的多啊。。。
然後它有一個功能很實用,就是數據跟蹤,當你在一個種類的圖表中選中標註數據後,轉換至另外一個類型的圖表後,這些數據仍然不會消失,這就讓分析起圖表變得更簡單些;上圖吧:
選中後,圖表的元素也會相應變色,然後很帥的時刻來了:
在由Density的圖錶轉化為3D堆棧圖後,原來標記的數據仍然顯示,並且圖表的動畫很cool,真的像是沙子在跳舞,就像超能陸戰隊裡面大白的主人控制那些粒子一樣;
這突然讓我覺得動畫對於數據圖表還是很有意義的,雖然很多圖表的動畫都是毫無意義,畫蛇添足,但SandDance的動畫確實加強了其本身數據的表現力,很positive;
圖表動畫一定符合當前數據的類型,該是什麼就是什麼,不然動畫真的百害無一利;
怎麼樣,這樣看起來更帥吧,數據多了真的挺美的
上面是泰坦尼克號上乘客的職業分布,還真是震撼
雖然SandDance主要以視覺化的展示為主,並不像Tableau, PowerBI, SAP Lumira這種功能更加全面,擴展性更強的軟體,但它起碼走出了一條正確的道路,可視化中至少將「視」發揮的淋漓盡致,然後在配合微軟自家的PowerBI,今後的發展令人期待。
同時它也支持觸屏操作,更加適合在大場合進行數據可視化展示,再加上不錯的動畫,在大屏幕前觀看應該會高潮。。。
(圖片截取於https://www.youtube.com/watch?time_continue=59v=w5Jx6SSYyDo)
這樣自己也能製作像QQ在線人數那樣的可視化界面,cool~
好的可視化圖表不僅要美觀酷炫,還有直觀展示數據,及時發現數據背後的含義,幾十種常見的圖表見下方!除了柱狀圖、條形圖、折線圖、餅圖等常用圖表之外,還有數據地圖(熱力圖、軌跡圖等)、人口金字塔、矩形樹圖、瀑布圖和散點圖,旭日圖,漏斗圖等酷炫圖表,一起了解下不同圖表的使用場景、優劣勢!這些數據可視化圖表均來自bdp(http://me.bdp.cn),拖拽即生成圖表~~
1.柱狀圖
適用場景:適用場合是二維數據集(每個數據點包括兩個值x和y),但只有一個維度需要比較,用於顯示一段時間內的數據變化或顯示各項之間的比較情況。適用於枚舉的數據,比如地域之間的關係,數據沒有必然的連續性。
優勢:柱狀圖利用柱子的高度,反映數據的差異,肉眼對高度差異很敏感。
劣勢:柱狀圖的局限在於只適用中小規模的數據集。
延伸圖表:堆積柱狀圖、百分比堆積柱狀圖
不僅可以直觀的看出每個系列的值,還能夠反映出系列的總和,尤其是當需要看某一單位的綜合以及各系列值的比重時,最適合。
(堆積柱狀圖)
2.條形圖
適用場景:顯示各個項目之間的比較情況,和柱狀圖類似的作用。
優勢:每個條都清晰表示數據,直觀。
延伸圖表:堆積條形圖、百分比堆積條形圖
(堆積條形圖)
3.折線圖
適用場景: 折線圖適合二維的大數據集,還適合多個二維數據集的比較。一般用來表示趨勢的變化,橫軸一般為日期欄位。
優勢:容易反應出數據變化的趨勢。
4.各種酷炫的數據地圖(一共有7種類型,最喜歡BDP的地圖了,尤其是動態軌跡圖,製作人口遷徙圖很方便~)
適用場景:適用於有空間位置的數據集,一般分成行政地圖(氣泡圖、面積圖)和GIS地圖(包括熱力圖、軌跡圖等)。行政地圖一般有省份、城市數據就夠了(比如福建-泉州);而GIS地圖則需要經緯度數據,更細化到具體區域,只要有數據,可做區域、全國甚至全球的地圖,支持百度地圖、騰訊地圖等。
優劣勢:特殊狀況下使用,涉及行政區域。
(1)行政地圖(面積圖):以顏色深淺來展示數據的大小!
(2)行政地圖(氣泡圖)
(3)GIS地圖:海量點
(4)GIS地圖:熱力圖(分別為全國熱力圖和上海區域熱力圖)
(5)GIS地圖:(北京某區域)散點圖
(6)GIS地圖:地圖+柱狀/餅圖/條形
(7)GIS地圖:軌跡圖,人口遷徙動態變化效果:https://me.bdp.cn/share/index.html?shareId=sdo_6b712c6cfd905db62b2c02c49e731f34
5.餅圖(環圖)
適用場景:顯示各項的大小與各項總和的比例。適用簡單的佔比比例圖,在不要求數據精細的情況適用。
優勢:明確顯示數據的比例情況,尤其合適渠道來源等場景。
劣勢:不會具體的數值,只是整體的佔比情況。
餅圖、環圖你喜歡那個呢,可以直接設置~
6.雷達圖
適用場景:雷達圖適用於多維數據(四維以上),一般是用來表示某個數據欄位的綜合情況,數據點一般6個左右,太多的話辨別起來有困難。
優勢:主要用來了解公司各項數據指標的變動情形及其好壞趨向。
劣勢:理解成本較高。
7.漏斗圖
適用場景:漏斗圖適用於業務流程多的流程分析,顯示各流程的轉化率。
優勢:在網站分析中,通常用於轉化率比較,它不僅能展示用戶從進入網站到實現購買的最終轉化率,還可以展示每個步驟的轉化率,能夠直觀地發現和說明問題所在。
劣勢:單一漏斗圖無法評價網站某個關鍵流程中各步驟轉化率的好壞。
8.詞雲
適用場景: 顯示詞頻,可以用來做一些用戶畫像、用戶標籤的工作。
優勢:很酷炫、很直觀的圖表。劣勢:使用場景單一,一般用來做詞頻。
9.散點圖
適用場景:顯示若干數據系列中各數值之間的關係,類似XY軸,判斷兩變數之間是否存在某種關聯。散點圖適用於三維數據集,但其中只有兩維數據是需要比較的。另外,散點圖還可以看出極值的分布情況。
優勢:對於處理值的分布和數據點的分簇區域(通過設置橫縱項的輔助線),散點圖都很理想。如果數據集中包含非常多的點,那麼散點圖便是最佳圖表類型。
劣勢:在點狀圖中顯示多個序列看上去非常混亂。
10.面積圖
適用場景:強調數量隨時間而變化的程度,也可用於引起人們對總值趨勢的注意。
延伸圖表:堆積面積圖、百分比堆積面積圖還可以顯示部分與整體之間(或者幾個數據變數之間)的關係。
11.指標卡
適用場景:顯示某個數據結果同環比數據。
優勢:適用場景很多,很直觀告訴看圖者數據的最終結果,一般是昨天、上周等,還可以看不同時間維度的同環比情況。
劣勢:只是單一的數據展示,最多有同環比,但是不能對比其他數據。
12.計量圖
適用場景:一般用來顯示項目的完成進度。
優勢:很直觀展示項目的進度情況,類似於進度條。
劣勢:表達效果很明確,數據場景比較單一。
13.瀑布圖
適用場景:採用絕對值與相對值結合的方式,適用於表達數個特定數值之間的數量變化關係,最終展示一個累計值。
優勢:展示兩個數據點之間的演變過程,還可以展示數據是如何累計的。
14.桑基圖
適用場景:一種特定類型的流程圖,始末端的分支寬度總各相等,一個數據從始至終的流程很清晰,圖中延伸的分支的寬度對應數據流量的大小,流量隨著時間推移變化的情況,通常應用於能源、材料成分、金融等數據的可視化分析。參考桑基圖 |簡單粗暴,年末就要「囤」技能!
15.旭日圖
適用場景:旭日圖可以表達清晰的層級和歸屬關係,以父子層次結構來顯示數據構成情況,旭日圖能便於細分溯源分析數據,通過分層佔比情況真正了解數據的具體構成。
優勢:分層看數據很直觀,逐層下鑽看數據。
16.矩形樹圖
適用場景:類似於旭日圖,兩者區別可參考矩形樹圖 | 開工啦,10秒就能學會新年第1個「雞」能哦!
17.對比條形圖(人口金字塔)
適用場景:在對多列數據進行對比時,而且數據標籤比較長的話,一般會採用條形圖做對比。
18.雙軸圖
適用場景:柱狀圖+折線圖的結合,適用情況很多,比如數量級相差很大的情況、數據同環比分析對比等情況都能適用。
優勢:特別通用,屬於不同圖表的組合使用,比如柱狀圖+折線圖的結合,圖表很直觀。
劣勢:這個好像沒什麼劣勢,個人感覺。
當然,當你分析數據的時候一定不會只用一種圖表,尤其是數據報告中,都會用到多個圖表,如下圖~
下面是深色背景(星空藍)下的圖表效果:
這些可視化圖表均來自數據可視化軟體BDP個人版!
數據可視化軟體,個人使用的話,我極力極力極力推薦的就是[數據觀]。
為什麼呢,因為工作原因,我試用過很多很多這方面的產品。
從Gartner魔力象限裡頭的領導者Tableau、Qliksense,到國內名聲比較響的帆軟、永洪bi。
估計得有快10個?
能讓我5分鐘之內就上傳好數據、根據需求處理一下、並且做成圖表的,就數據觀一個。
產品設計得太友好了!太容易上手了!
——————————————————————————————————
忍不住想舉個 。
上周我們銷售總監說,你們看友商的公眾號了嗎?寫的比咱們好啊!你們行不行啊?能不能給點力啊??
我心想:有這事兒?丟臉丟大了?連忙點開友商公眾號,看了一個月的文章,結果發現,從選題到閱讀量,好像……都沒有我們好啊???這難道是銷售拉不到單,要我們背鍋哇??
作為具有部門自豪感的人員,當然不能忍辣!
說好的市場部跟銷售團隊一起並肩作戰呢?
說好的我給你們提供內容支持你給我們把錢錢拿回來呢?
還能不能同心協力服務客戶辣?
但是,直接懟回去,就把我們部門逼格拉低了。
對付別人的主觀感受,最有力的武器,就是客觀事實。
於是決定,用數據說話!
於是,就有了這樣一個板子:
——————————————————————————————————
上面一溜用的是KPI圖,主要是告訴他幾個重要指標(我們的成績)
1、自從公眾號啟動之後,我們總共發出了7篇文章;
2、這七篇文章,圖文頁閱讀次數是5252次,平均每篇文章750多(友商的可以進去拖到末尾看,每篇100~200左右);
3、文章一共被分享、轉發了436次,平均每篇獲得62次左右;
4、文章一共被收藏了105次,平均每篇文章獲得收藏15次左右。
下面的柱圖,是七篇文章的圖文閱讀數量,其中黃色柱子代表圖文閱讀人數,藍色柱子代表圖文閱讀次數。跟上面的KPI也算做一個互證,點進去還可以看到具體明細,省得你說我編數據騙你!
然後是微信收藏數量,和分享轉發次數這倆柱圖,同樣,黃色代表按人算,藍色按次數算,排列的順序是,按照人的降序來,這樣這個板子對我們市場部的工作也有指導意義,可以看出來,什麼樣的文章更受讀者喜歡;
最後倆KPI,展示的是公眾號啟動之後,最新的粉絲數量是多少,以及這幾天凈增了多少。當然,這個數字還沒有達到我的理想狀態,所以被我隱藏辣!
——————————————————————————————————
拿著這塊板子,我溫柔滴把它投在了公司會議室(開放式)的電視上,給我們銷售大大演示了一下。
銷售大大的表情比較精彩,我現在都還在回味。
————————————————————————————————————————————————————————————————————
其實,同一個公司的不同部門、甚至同一個部門不同人員之間,所認識到的事實,並不是統一的事實。
一個公司,尤其是初創公司,想要發展,除了把產品做好之外,就是要讓公司全員上下一條心,在同一個事實下,用同一套語言說話。
這時候,數據雖然可能不是最完美的,但往往是最容易依靠、也是最可靠的。
所以,就算我們不響應馬爸爸的號召,還是會進入DT時代。
有一樣思路的小夥伴嗎?我們握個手吧!
——————————————————————————————————
那麼,DT時代,什麼樣的數據處理工具最靠譜?結合Gartner的報告,還有市面上一些產品試用,我認為必須要有如下幾點:
1、一站式:就是從數據的搜集,到最後的彙報,都能用同一個軟體或是在同一個平台上完成,並且要有流程感,不可以彼此孤立。要跟著工具流暢地行走,而不是進入工具像進入迷宮一樣。
2、自服務:數據的許可權以及處理都不能再卡在所謂的IT部門了,每個人都應該主宰自己相關的數據,並且有能力讓這部分數據為自己所用。自服務地連接,不用寫sql文就能調取、查看自己想看的指標;自服務地處理數據,自服務地可視化成為各種各樣的圖表,並且根據分析思路來編排。
3、協作:在產品/平台裡面,在每一張圖表當中,都應該可以和相關的人聊天,或者你叫溝通也行!只要你分享了許可權,你的夥伴也可以在你的看板上過濾,下鑽,優化看板,添加標籤等等~~~打破數據孤島的下一步,就是打破工作孤島。唯有基於數據協作,才有可能達成企業共識,把工作變成合作~
最後我還想說,數據分析的門檻降低了,並不說明數據分析不牛逼了,而是說,因為有了科技的發展,我們才得以在數據面前不做個傻子。希望我們每個人都能跟數據對話。
為了讓開發者更好地使用數據可視化工具,雲棲社區組織翻譯了GitHub上的 Awesome dataviz ,其幾乎囊括了優秀的數據可視化框架,庫和軟體。涵蓋了支持JavaScript,Android,C++,Golang,iOS,Python,R語言和Ruby等編程語言的數據可視化工具,精彩不容錯過。
內容目錄
- Awesome dataviz
- JavaScript 工具
- 圖表庫
- 圖形圖表庫
- 地圖(Maps)
- d3
- dc.js
- Misc
- Android 工具
- C++ 工具
- Golang 工具
- iOS 工具
- Python 工具
- R 工具
- Ruby 工具
- 其他工具
- 資源
- 參考書籍
- 資源網站
JavaScript 工具集
圖表庫
- C3 - 以 d3 為基礎構建的可重用圖表庫
- Chart.js - 帶有 canvas 標籤的圖表
- Chartist.js - 具有強大瀏覽器兼容能力的響應式圖表
- Dimple - 適用於業務分析的面向對象的 API
- Dygraphs - 適用於大型數據集的互動式線性圖表庫
- Echarts - 針對大型數據集的高度定製化互動式圖表
- Epoch - 可以完美創建的即時圖表
- Highcharts - 基於SVG和VML呈現的圖表庫. 免費 (CC BY-NC 可用於非盈利項目)
- MetricsGraphics.js - 能夠針對時間序列數據進行優化
- Morris.js - 非常漂亮的時間序列線狀圖
- NVD3 - 使用 d3.js 實現的可重用性圖表庫
- Peity - 可創建小型內連 svg 圖表
- Plotly.js - 支持20種圖表類型的強大的聲明式庫
- TechanJS - 股票以及金融圖表
圖形(graphs)圖表庫
- Cola.js - 通過基於約束的優化技術創建圖表的工具. 和 d3 以及 svg.js 共同發揮作用
- Cytoscape.js - 由 Cytoscape 核心開發人員維護的用於繪製圖形的 JavaScript 庫.
- Linkurious - 一款基於 Sigma.js 的能加快圖形可視化和互動式應用的開發速度的工具箱
- Sigma.js - 致力於圖形繪製的 JavaScript 庫
- VivaGraph - 針對 JavaScript 的圖形繪製庫
地圖(Maps)
- CartoDB - CartoDB 是一款開源工具並且其允許對網頁上的地理數據進行存儲和可視化
- Cesium - WebGL 虛擬地球儀和地圖引擎
- Leaflet - 對移動端友好的互動式地圖JavaScript 庫
- Leaflet Data Visualization Framework - 使用了 Leaflet 的設計用於簡化數據可視化和主題映射的框架
- Mapael - 基於 the.js 的能夠展示矢量地圖的 jQuery 插件
- Mapsense.js - 將 d3.js 和瓷磚式覆蓋地圖結合起來
- Modest Maps - 使用 Javascript,依照 BSD 許可的瓷磚覆蓋式為基礎展示和交互地圖庫
d3
- 參見 Awesome D3
dc.js
dc.js 是一個多維圖表構建工具,其能夠與 crossfilter 完美地配合工作
- angular-dc - dc.js 的 AngularJS 指令
- dc.leaflet.js - 使用了 Leaflet 地圖的 dc.js 圖表
- ember-dc - dc.js 的 Ember Component Wrappers(組件包裝)
雜項
- Chroma.js - 用於處理色彩的小型庫文件
- Piecon - 圖標上的餅狀圖繪製工具
- Recline.js - 使用純 JavaScript 和 HTML 的用於構建數據應用的簡單而又強大的庫
- Textures.js - 用於創建 SVG 模式的庫
- Timeline.js - 創建互動式時間線
- Vega - Vega 是一個用於創建,保存和分享互動式可視化數據設計的語法和格式
- Vis.js - 一個包括了時間線,網路和圖表(2D和3D)的動態可視化庫
安卓工具
- HelloCharts - 兼容安卓 API 8及以上版本的圖表庫
- MPAndroidChart - 一款功能強大而又易於使用的圖表庫
C++工具
- Visualization Toolkit (VTK) - 用於3D圖形和圖像處理和可視化的開源庫
Go語言工具
- Charts for Go - 基於 Go 的基礎圖表. 其能夠對 ASCII、 SVG 和 圖像進行渲染
- svgo - 針對 SVG 的 Go 語言庫
iOS工具
- JBChartView - 同時支持線性和條形圖的圖表庫
- PNChart - 使用了 Piner 和 CoinsMan 的簡單並且美麗的圖表
- ios-charts - MPAndroidChar 的 iOS 埠. 其可以使用非常簡單的代碼為兩個平台創建圖表
Python工具
- bokeh - 用於 Python 的互動式網頁繪圖工具
- ggplot - 與ggplot2 面向R語言的 API相同
- glumpy - OpenGL 科學可視化庫
- matplotlib - 2D 繪圖庫
- pygal - 一個動態 SVG 圖表庫
- PyQtGraph - 互動式和實時的 2D/3D/圖像 繪製以及科學/工程工具
- seaborn - 一個能夠製作極具吸引力的和展現翔實統計信息數據的圖表庫
- toyplot - 目標為大型數據圖表的小型 Python 數據圖表繪製工具
- Vincent - 面向 Vega 翻譯器的 Python 工具
- VisPy - 基於 OpenGL 的高效科學可視化工具
- mpld3 - Matplotlib Graphics的 D3 渲染工具
R工具
- ggplot2 - 一個基於圖形語法的繪圖系統
- lattice - R語言格子圖形
- plotly - 互動式圖表(向 ggplot2 的輸出中添加了交互性), 統計圖和簡單網路圖
- rbokeh - 針對 Bokeh 的R語言介面
- rgl - 使用了 OpenGL 的3D 可視化
- shiny - 用於創建互動式應用和可視化的框架
- visNetwork - 互動式網路可視化
Ruby工具
- Chartkick - 使用 Ruby 的單線創建圖表的工具
其他工具
不與特定平台或語言綁定的工具
- Charted - 一個能夠從任何數據文件中創建自動化,可分享的圖表的工具
- Gephi - 一個用於可視化和製作大型圖表的開源平台
- Lightning - 一個提供以API為基礎的方式獲取可再生,網路為基礎的互動式可視化圖表的數據可視化服務
- RAW - 由 CSV 和 Excel 文件創建的網路可視化工具
- Spark - 命令解釋程序(shell)走勢圖. 其包含多種實現語言
- Periscope - 直接由SQL查詢語句創建圖表
參考書籍
- Design for Information 作者: Isabel Meirelles
- The Best American Infographics 2014 作者: Gareth Cook
- The Visual Display of Quantitative Information 作者: Edward Tufte
- The Wall Street Journal Guide to Information Graphics 作者: Dona M. Wong
- Visualization Analysis and Design 作者: Tamara Munzner
資源網站
- FlowingData
- Information is Beautiful
- The Data Visualization Catalogue - 一個數據可視化工具的集合,優缺點兼具
- Visual Complexity - 關於複雜網路可視化的網站
原文鏈接:Awesome dataviz GitHub
譯者:賈子甲 校對:劉崇鑫 王殿進
如果發現原文翻譯有誤,請郵件通知雲棲社區(yqeditor@list.alibaba-inc.com),感謝您的支持。
數據觀
- Datamatic.io
- ECharts · Example
- Lucidchart | Diagrams Done Right
- Excel
---------------------------------------------------------------
順手看了一下其他同話題下的其他問題。
有哪些值得推薦的數據可視化工具? - 商業
---------------------------------------------------------------
你確定你搜了?
你確定你看了別人的答案?
你確定你是認真的?
大家似乎都覺得在專業圖表製作過程中,軟體的選擇極為重要。在「知乎」上曾看到一個關於科學專業圖表製作軟體的帖子,當有人問到用哪款軟體能畫出漂亮的專業圖表時,網友們都給出了自己的答案:如何在論文中畫出漂亮的插圖? - 科研。
圖1.2.1(a) 是在Python語言matplotlib中使用半透明的配色,顯示出高手1所說的那高貴冷艷的風格。Python為了進一步提升自己的繪圖能力,還開發了Prettyplotlib和Seaborn兩個繪圖包。Seaborn的繪圖風格和R語言的ggplot2很類似。
圖1.2.1(b) 是使用Matlab 2013a經調整和修飾展現的散點圖,效果還不錯。Matlab 2014b 推出了全新的Matlab圖形系統。全新的默認顏色、字體和樣式便於數據解釋。被大家吐槽的線條鋸齒的醜陋默認配色也都已經改進,抗鋸齒字體和線條使文字和圖形看起來更平滑。
圖1.2.1(c) 是使用R語言ggplot2包繪製的散點圖,灰色背景和白色網格線的搭配給人清新亮麗的感覺。ggplot2包的開發者還開發了繪圖效果類似的gcookbook包。但是也如高手3所說,R語言並不能很好地展示三維立體圖,這也是它最大的缺陷。
但是不管這三款繪圖效果到底如何,這三款軟體一個共有的特點就是它們需要編程才能實現繪圖功能,對於大部分沒有編程基礎的學生來說,這是一個很大的繪圖障礙。然而,你不需要擔心,因為有一款不需要編程基礎就能實現這些軟體的繪圖效果,它就是眾所周知的Excel。
使用Excel 2016模仿圖1.2.1繪製的散點圖,如圖1.2.2所示。Excel繪圖效果是不是幾乎跟這三款軟體展示的效果一樣?在繪製二維圖像方面,我覺得Excel是當之無愧的劍中之屠龍寶刀,它不僅能繪製出各種軟體所展示的圖像效果,也能自由控制所有的圖表元素。
Excel、Python、Matlab或Mathematica、R、Tableau、D3.js 是數據可視化領域中十分優秀的圖表製作軟體。Excel繪製科學圖表的方法與配色可借鑒這幾款軟體。Python、R、Tableau和D3.js的圖表風格和配色效果各有各的特點,都是值得深入學習並應用到Excel科學圖表的繪製中。
Tableau 是桌面系統中最簡單的商業智能工具軟體,Tableau 沒有強迫用戶編寫自定義代碼,新的控制台也可完全自定義配置,是一款功能超級好用、效果超級美觀的商業圖表繪製軟體,但它是一款商業軟體,需要付費才能使用,而且主要應用於商業數據的分析與圖表製作。
D3.js是最流行的可視化庫之一。D3幫助你給數據帶來活力通過使用HTML、SVG和CSS,D3重視Web標準為你提供現代瀏覽器的全部功能。D3.js是一款專業級的數據可視化操作編程庫,是基於數據操作文檔JavaScript庫。所以它也需要編程才能實現,而且編程比Matlab、R和Python更複雜。
使用D3.js的d3.layout.cloud.js繪製數據可視化軟體的標籤雲(Tag Cloud),如圖1.2.3所示。不知道你認識或熟悉的數據可視化軟體有幾款,但這些並不重要,只要你會使用Excel就足以解決一維和二維數據的可視化。
另外,我們來看看不同軟體繪製的效果圖,包括常見的Origin、Sigmaplot、GraphPad、Matlab、Python。
最後,我想說,有一款平凡的軟體能繪製這些軟體圖像的效果,但又不需要編程基礎就能實現,它就是眾所周知的 Excel。Excel才是王道!使用Excel仿製的Python、Matlab、R繪製的散點效果圖,幾乎沒有差異。
EasyCharts團隊出品
帥的人都關注了EasyCharts團隊^..^~
QQ交流群:454614789
微信公眾號:EasyCharts
更多信息敬請查看: http://easychart.github.io/post/Easycharts/
根據個人經驗和不同的使用目的回答一下:
科研目的:最常用是Matlab,好處是處理靈活,功能強大。缺點是在企業中應用較少,圖比較丑。。。
統計建模用:
- R語言。好處是ggplot2等R包專門為可視化開發的包。優點是貌美,並且封裝得好,直接調用即可,在程序語言中屬於相當容易上手的。缺點是R是基於內存處理方式,並且對數據的處理原理是全部讀取之後,再一起處理,所以對內存的需求很大,本地處理上G的數據的話,一不小心就崩潰了。。。。
- Python。好處是靈活,數據處理能力非常強,編程語言中做數據模/機器學習非常友善工具。缺點是可視化不是很貌美。。。統計方面包沒有R那麼多。
BI/數據監控/業務分析用:
- 付費SAAS軟體GrowingIO,數據採集/數據可視化/分析果的智能推薦,一站搞定。優點是貌美/方便/基於產品和業務,缺點是封裝比較嚴重,不是非常靈活。
2. 付費可視化工具Tableau。專註於做數據可視化好多年,功能非常強大,可以連接資料庫。優點是上手非常快,貌美。缺點是個人使用的話應該是買不起,可以去萬能的淘寶找破解版。
3. 除此之外,還有微軟PowerBI、Gephi等等,不一一介紹了~
大家有疑問的話,可以私聊繼續探討~
R里的ggplot2
Python的matplotlib
R和Python都可以的Plotly
這些導出pdf格式可以用AI調整最後效果。
想交互的話試試D3
Processing也不錯。
Gephi
必須是Tableau 啊。http://www.rinterest.cn/course/index/10有更詳細的學習內容。你可以看看,我就是在這裡看到的,比較容易上手,製作過程也很快。
各位大神都介紹了很多國外的工具,包括像是Tableau 這種比較優秀的,可惜收費啊,我也試著用了下,比較繁瑣,後來在網上找了一個國內的,還算比較符合國情吧,拿出來跟大家分享下:
圖表秀 http://tubiaoxiu.com
這個我覺得有幾個點比較適合我,第一是免費 哈哈 第二是比較容易上手 適合我這種比較小白的新手,國外很多軟體用起來感覺麻煩,第三是這個工具可以將做好的圖 直接導出來到PPT或是形成一個HTML連接,保存到電腦里 隨時都可以給別人展示,也不用聯網了。
靜態圖片:R的ggplot2、python的seaborn
交互網站:Echarts、D3
視頻展示:processing
放一些我做的可視化案例吧:
SODA | 大規模人群的識別和疏散
魔鏡杯 | 數據產品分析可視化平台
數據 | 環境問題
知乎專欄
希望更多的人愛上數據可視化~
最後安利一下,我製作了一個「全棧數據工程師養成攻略」的系列視頻教程,持續更新中,對數據工程涉及到的相關內容做一個概覽,幫助大家快速入門、提升興趣。裡面也會涉及到使用R、Echarts、D3、Processing等進行可視化的內容,如果有興趣可以關注一下~
全棧數據工程師養成攻略 - 網易雲課堂
Gephi是一個全平台的互動式可視化平台,它特別適用於複雜的大數據可視化工作。下載實時可視化
- Gephi使用的高速引擎可以快速迭代出你想要的圖像。
- 超大網路,從5w節點到100w節點都可以支持。
- 大量可用工具。
高效簡易的布局工具
對複雜圖進行布局是一個困難的問題,而Gephi提供了最簡易高效的布局演算法。軟體還支持在迭代的同時移動單個或是一片節點。你還可以在market中下載更多的plugin,其中也包括了來自不同開發者的其他布局演算法。
簡易教程歡迎訪問我的博客 可視化網路 Gephi推薦plotly
它對Python、R、MATLAB及JS都提供了相應的API介面(每天可免費調用250次)。同時,plotly提供了豐富的可視化案例和模版,使用既有的框架,做好數據的清洗和整理,就能做出需要的圖形。
以下是我應用Python +plotly 對全球恐怖襲擊數據做的一些可視分析,具體的分析報告及動態版圖形見 知乎專欄。
具體的作圖代碼(Python版本)見:GitHub - bnuFisher/data_vis
視覺圖表: https://appsto.re/cn/y2c-ab.i
支持 iPhone 和 iPad
支持在 iMessage 中傳送圖表
1.excel;
2.BDP個人版(http://me.bdp.cn)
3.cartoDB(http://cartodb.com/)
DataHunter
Excel
PowerBI
可以試試smartbi,對小微用戶免費,包含儀錶盤,數據可視化,大屏展現,自助探索分析,最近在搞線上培訓,效果挺好的。
推薦閱讀: