數據可視化有哪些分類和圖形?


感謝關注天善智能,走好數據之路↑↑↑

歡迎關注天善智能,我們是專註於商業智能BI,人工智慧AI,大數據分析與挖掘領域的垂直社區,學習,問答、求職一站式搞定!

天善學院雙十一五場微課免費直播,

11月6日年邁的數據分析師教你做年終總結報告

陳丹奕:知乎大神,前百度資深數據分析師

11月7日機器學習與工業實踐

鄒博:中國科學院副研究員,天津大學特聘教授

11月8日 貝葉斯演算法與新聞分類實戰

唐宇迪:深度學習領域多年一線實踐研究專家,同濟大學碩士

11月9日破冰Python,1小時快速入門

王大偉: Python愛好者社區公眾號負責人,擅長網路爬蟲、數據分析

11月10日 職場也有雙11--你賤賣自己的5大常用技巧

陳文:8年經驗數據分析師,資深業務顧問

加直播管理員:xtechday,進入直播交流。

提到數據分析,就一定會有數據可視化。因為字不如表,表不如圖,圖像可以更加直觀清晰的表達數值所無法表達的含義。可視化是數據分析的核心理念,我們往往會追求圖表儘可能的具有美感,但是具有美感的圖表不一定是有用的圖表,兩者之間不能劃等號。

數據可視化的目的是讓數據更高效,讓讀者快速了解而非只是自己使用才是我們最終的目標。在突出數據背後的規律,突出重要因素的前提下我們再進行美觀上的優化才是正確的選擇。

圖表的基礎概念

維度:描述分析的角度和屬性,分類數據。時間,地理位置,產品類型等

度量:具體的參考數值,數值數據。元,銷量,銷售金額等

圖表類型與應用散點圖

主要解釋數據之間的規律

維度:0+

度量:2

圖1

氣泡圖(變種的散點圖1)

氣泡圖是散點圖的變種,引入了第三個度量作為氣泡的大小

維度:1+

度量:3

圖2

單軸散點圖(變種的散點圖2)

維度作Y軸,更傾向於洞察數據在不同類別下的數據規律

維度:1+

度量:2

圖3

折線圖

用來觀察數據隨時間變化的趨勢(維度不易過多,否則會容易造成混亂和複雜)

維度:1+

度量:1+

圖4

面積圖(變種的折線圖)

注重數據類別之間隨著時間趨勢的變化關係

圖5

柱形圖

展現類別之間的關係

維度:2

度量:1+

圖6

直方圖(柱形圖的變種)

統計型柱形圖

維度:0

度量:1

圖7

其他柱形圖:正負比例柱形圖,翻轉比例柱形圖,堆積柱形圖,百分比堆積柱形圖,瀑布圖等

餅圖

數據分析一般用不到

維度:1

度量:1

圖8

漏斗圖

對轉化過程的直觀展示,轉化步驟不宜超過七個

維度:1

度量:1

圖9

雷達圖

個體的數據和屬性的可視化方案,比較偏描述性的數據

維度:1+

度量:1+

圖10

樹形圖

數據量較大,類別較多的數據分析時經常使用

維度:1+

度量:1

圖11

桑基圖

揭示數據複雜變化趨勢,可以一對多或者多對一

維度:2

度量:1

圖12

熱力圖

可以體現數據在空間上的變化規律

維度:1

度量:1

圖13

關係圖

展現不同類別之間的數據關係

維度:2

度量:0+

圖14

箱線圖

研究觀察和對比數據分布

維度:1+

度量:1

圖15

標靶圖

用于衡量業務銷售完成情況

維度:1+

度量:2

圖16

詞雲圖

直觀大氣展現大數據的最優先圖表之一

維度:1

度量:0

圖17

地理圖

用於展現數據和空間之間的關係

維度:1

度量:1

圖18

以上是數據可視化圖表的初步學習,感謝瀏覽。


作者曾經寫過系列文章《R語言數據可視化》,在這裡給大家做一個大概的總結,從簡單到複雜,介紹了條形圖到相關圖,再到地圖可視化等多種數據可視化圖表的應用場景及實現方式,感興趣的讀者可以作者主頁查看詳細內容。

條形圖餅圖和扇形圖直方圖和核密度圖

直方圖通過在X軸上將值域分割為一定數量的組,在Y軸上顯示相應值的頻數,展示了連續型變數的分布。

核密度估計是用於估計隨機變數概率密度函數的一種非參數方法,核密度圖不失為一種用來觀察連續型變數分布的有效方法。

箱線圖/盒須圖

繪製連續型變數常用的五個描述性統計量,從下到上依次是:最小值,下四分位數(25%分位數),中位數(50%分位數),上四分位數(75%分位數),最大值。

小提琴圖

小提琴圖是箱線圖和核密度圖的結合,在縱軸展示了數據分布的核密度估計曲線。

點圖

在水平軸上繪製大量有標籤的數值的方法。也就是你想比較大量不同類別下數據值的差異時,可以使用點圖,使用條形圖等其他圖形視覺效果較差。

散點圖矩陣

散點圖矩陣可以非常直觀地看到多個變數兩兩間的相關性,是變數間相關性分析的一把利器。

高密度散點圖

高密度散點圖主要是用來解決當大數據集而又有很多點可能重合的數據可視化問題,基本上就是大家常說的熱力圖。

三維散點圖

三維散點圖主要是解決需要可視化的數據維度大於2維的情況,當然當數據大於2維時三維圖並不是唯一的解決辦法,還有氣泡圖以及分系列的散點圖等,有時候我甚至覺得三維散點圖雖然看上去炫一點,但是信息的呈現方式並不如氣泡圖和分系列散點圖直觀。

氣泡圖、折線圖和馬賽克圖

  • 氣泡圖:三個定量變數之間關係的可視化展示

  • 折線圖:將散點圖的點連接起來就可以得到折線圖,用於兩個定量變數之間關係的可視化展示

  • 馬賽克圖:多個類別變數之間關係的可視化展示

相關圖

相關圖則是專門為解決眾多二元變數兩兩之間相關關係的可視化而設計的圖形,它將以更加簡單直觀的方式展示多個變數兩兩之間相關性的強弱。

地圖可視化點圖

地圖可視化點圖,主要是用來對一些與地理位置有關的值進行可視化操作,把值在相應的地理位置上標出來。比如不同地方的銷售量,不同地方的營業額這些都可以通過地圖可視化點圖的方式將其展示在地圖上,清晰明了地就可以看到各地數據的差異。

未完待續~


分類的話我不是很清楚,作為一個可視化見習程序員來說一下圖形。首先我們在規劃之初就應該訂好一張可視化報表應該有哪些數據,可視化並不是做的越細越好,通常情況我們展示的是一種趨勢波動或異常告警。可視化報表圖表選擇也很重要比如年數據增長我們一般採用折線圖或柱狀圖,一些品類佔比可能採用面積圖或雷達圖。

一般我在可視化方向主要做的就是數據大屏,這個時候主界面的設計配色,圖表的選擇顯得非常重要,而且大屏並不是越多越好。能夠凸顯問題才是重點。

更廣泛的數據可視化就非我能力所及啦


推薦閱讀:

你網購過最奇葩的東西是什麼?
在網上註冊了人人貸、融360等等,但沒在那裡面借錢會不會有什麼影響?
為什麼很多人叫陳一發媽媽?
視頻彈幕會不會是移動互聯網社交的下一個風口?
周鴻禕在中國互聯網是一個怎樣的存在?

TAG:數據挖掘 | 互聯網 |