可視化圖表初階

簡述

數據可視化-通過圖表形式展現數據,幫助用戶快速、準確理解信息。準確、快速是可視化的關鍵,好的可視化會「講故事」,能向我們揭示數據背後的規律。對於可視化,有一個常見誤區:分析師追求過於複雜的圖表,反而使得業務人員難以理解。其實越簡單的圖表,越容易被理解,而快速易懂地理解數據,正是可視化最重要的目標

大多數人對於基礎的數據圖表都有一定的認知,但卻未必清楚,在哪一種場景使用何種圖表,本文主要給大家介紹基礎圖表的特性,讓大家知道在何種場景使用該類型圖表。

圖表的基本組成元素

一張圖表至少包含:標題、橫縱坐標軸、數據系列、數據標籤、圖例等部分,每一部分都在圖表中扮演特定的角色表達特定的信息。當然這些元素並不是必須具備的,當信息足夠清晰時,你可以精簡部分元素,使得圖表更加簡潔。

正確理解維度與指標

維度(Dimension)

類別型欄位、一般是離散的、不可進行四則運算

常常是觀察數據的角度,往往是橫坐標

度量/指標(Measure)

數值型欄位、一般是連續的、可進行四則運算

一般都是數據的數值化衡量,往往是縱坐標

------------------------分割線----下面是4種常見、常用基礎圖表-------------------------------

1. 折線圖「家族」

折線圖的核心思想是 趨勢變化

作為信息最明了的圖表,是各種圖表中最容易解讀的圖表,以下是它的幾種變種:

基礎折線圖

技巧1:添加關鍵運營事件標記

技巧2:添加趨勢線,當R2>0.6時可採納該趨勢線,R2越接近1,趨勢越可靠

堆積面積圖

面積大小對應該類別數值大小,反映不同類別佔比關係及其時間趨勢變化。以下圖為例,你可看出AppStore和360下載量Top1、2的渠道。

缺點:由色塊面積來表示數值大小有時候不直觀。以下圖為例,需仔細看圖才能知道AppStore和360手機助手是有做過投放的

折線圖小結

1)折線圖是點、線連在一起的圖表,可反映事物的發展趨勢和分布情況;

2.)適合在單個數據點不那麼重要的情況下表現變化趨勢、增長幅度。

2. 柱形圖「家族」

柱形圖的核心思想是 對比

累加柱形圖

適合少量類別的對比,且對比信息特別清晰

與堆積面積圖相比,堆積面積圖比累加柱形圖多一時間維度,它可表達時間維度上的趨勢變化。

多指標柱形圖

主要運用於多個指標進行對比分析的場景,但類別對象不宜過多,當超過5個,不適合使用此圖表

技巧:當各對比指標大小相差10倍甚至更大時,可採用標準化,如:對數值取自然對數,既能有效縮小指標量度差距,也能保留同指標的大小關係

條形圖

當對比對象類別>5時,將多指標柱形圖更改為單指標的條形圖,能有效提高數據對比清晰度

條形圖,必須按照數值大小降序排列,這是提升條形圖閱讀體驗的重要手段

瀑布圖

核心是按維度/指標下鑽分解,如:公司收入各用途分解、公司年利潤按分公司分解、業績按銷售團隊分解;

對比餅圖的優勢在於,拆解項較多時,瀑布圖通過數字的標記仍可清洗辨別,而餅圖在分解項>5時就不易辨別。

柱形圖結合折線圖

對比多個指標,尤其是對比指標與指標的增長率上非常適用,使得一個圖表可以表現兩個層次的信息。(當然要儘可能避免信息的重複。如下圖,折線圖含義如果換成團隊簽約數占公司總簽約數比例,則意義不大)

使用雙坐標軸,要表明清晰

直方圖

當橫坐標變成連續的分組,就可以製作直方圖(與柱形圖主要差別在於,直方圖一般不同數據系列沒有間距)

當組別劃分無限細化,我們就可以繪製概率分布曲線或者稱為密度曲線,最常見的就是正態分布,這裡不舉例。

柱形圖小結

1) 核心是對比,柱形圖的目的是將對比信息放大,直觀呈現出來;

2) 由於直觀,柱形圖適合做結論的表達;

3) 柱形圖一般不用在時間維度的變化;

4) 柱形圖的數據系列和點不宜過多,否則建議改變圖表形式;

5) 柱形之間的寬度盡量小於柱形本身的寬度。

3. 散點圖「家族」

散點圖的核心思想是 研究

研究型圖表,適合用於發現變數間的關係與規律,不適合用於清晰表達信息的場景

基礎散點圖

基礎散點圖觀察兩個指標的關係

氣泡圖

在基礎散點圖上添加一個維度:用氣泡大小表示新的一個維度

下圖中,氣泡大小表示配送費用

基於散點圖的分類矩陣

分類運營,精準運營是現代化運營的一個重要課題,通過分類矩陣進行分類是一個有效手段

難點1: 構建指標可用於分類的橫縱坐標軸指標,這需要很強的業務認識

難點2: 確定指標的分界點,同樣需要足夠的業務判斷能力

散點圖小結

1) 散點圖作為研究型圖表,經常在數據分析前期被使用,在報告中很少見;

2)散點圖不夠直觀,大多時候不能直接表達結論;

3)散點圖對於業務敏感度和數據意識要求較高;

4)散點圖只是入門的鑰匙,發現規律只是分析的切入口。

4. 餅圖「家族」

餅圖的核心思想是 分解

基礎餅圖

技巧:將需要突出顯示的部分,置於左上角,順時針方向

旭日圖

旭日圖在基礎餅圖上可表達更多層次的分解關係,如下圖:有季度分解、月度分解、再到每周,且每個維度之間可兼容包含

餅圖小結

1) 一般來說,數值最大的部分排在最前面,也就是12點鐘方向順時針;

2) 餅圖的細分項不宜過多,一般不超過8項;

3) 不要製作三維的餅圖,不直觀;

4) 切忌將餅圖拉得過開,若要突出某一塊,可單獨將其拉開。

其實,個人覺得餅圖在實際場景中應當儘可能少的使用(因人眼對面積大小不敏感),而且對指標的分解柱形圖同樣能勝任,且遠遠清晰於餅圖。

當且僅當,用於反應單個模塊佔整體比重時,適合用餅圖,如下圖:

附學習資料

胡晨川 <<數據可視化速成手冊>

數據可視化-一起大數據

數據可視化:你想知道的經典圖表全在這 - 天善智能:專註於商業智能BI和數據分析、大數據領域的垂直社區平台

常用的圖表解析(二)--數據類圖表的衍生類型 - 天善智能:專註於商業智能BI和數據分析、大數據領域的垂直社區平台

數據可視化:柱狀圖、雷達圖等六種基本圖表的特點和適用場合 - 天善智能:專註於商業智能BI和數據分析、大數據領域的垂直社區平台
推薦閱讀:

看科技創新如何改變數字營銷業務--帶你了解什麼叫「數字營銷」
菜鳥v.蜂巢 v.消費者
R中數據缺失值的處理--基於mice包
美國大選Facebook輿情分析——基於R
不得不知的數據競賽之「最」——最全數據競賽匯總

TAG:数据 | 数据可视化 | 数据分析 |