關於數據可視化的一些思考
前前後後參與了公司三個產品的設計工作,算是對自己的一個總結吧。寫得比較凌亂,想到了什麼就寫了,還請大神們多多指教。
如何選擇合適的圖表?
製作圖表的第一步就是要確定相對關係,以下列舉五類。
成分:佔總體的百分比
項目:項目的排名
時間序列:如何隨著時間變化
頻率分布:項目的分布情況
相關性:變數之間的關係
1.成分相對關係:
顯示各部分佔整體的比重
成分相對關係最好使用餅圖。因為一個餅圖能夠給你一種整體的形象,如果你的目的是展示每一部分所佔全部的百分比,餅圖是你最好的選擇。
1.1單個整體:
1.1.a餅圖
餅圖其實沒什麼好說的,相對來說餅圖比較簡單。
從用戶體驗的角度來說,我們做了以下幾個優化。
1.在沒有特殊要求的情況下,我們將餅圖的數據進行了一個降序排列,因為在實際使用過程中,我們發現如果數據十分相近,是比較難通過肉眼來分辨的。並且如果有「其他」這一類,我們會放在最後面。
2.餅圖不適用於分類數量多的情況,因為隨著分類的增多,每個扇形就會變小,最後導致大小區分不明顯,每個切片看上去都差不多大小,這樣對於數據的對比是沒有什麼意義的。在「用圖表說話」這本書中,說餅圖最多不能超過六個項目。但在實際應用中,很難按照這個規範去做。經過長時間的測試和觀察,我覺得項目不要超過10個,如果分類特別多,我推薦使用柱狀圖或者條形圖。
1.1.b環形圖:
在餅圖中間挖一個洞,就變成了環形圖。
1.2多個整體:
多個含有多個項目的整體進行對比時,使用餅圖就比較難看出兩者之間的差別了。
所以對於多個整體,我們推薦使用堆疊圖。添加輔助線可以進一步提升某一個項目在不同的整體里的區別。
2.項目相對關係:
顯示各項目的排列次序
項目相對關係可以用柱狀圖或者條形圖來表示。按照你想要強調的方式可以把條形圖排列成任何順序。有的時候我們可能想要用柱狀圖來代替條形圖。這本身並沒有什麼錯,但是有以下兩點小小的問題:1.通過條形圖可以減少把分類的對比關係誤解為時間序列相對關係的可能。2.通常,分類都有著冗長的圖注,這樣會導致分類名層疊。(下面會具體舉例說明)
2.1單個整體
2.1.1一個分類只含有一個成分:
2.1.1.a柱狀圖:
遇到的問題:
當縱向柱狀圖顯示的分類很多時會導致分類名層疊。
兩種解決方案:
- 分類名稱整體切斜。
- 使用橫向柱狀圖(條形圖)。
2.1.2一個分類含有多個成分:
2.1.2.a縱向堆疊圖:
縱向堆疊圖可以形象得展示一個大分類包含的每個小分類的數據,以及各個小分類的佔比,顯示的是單個項目與整體之間的關係。
2.1.2.b橫向堆疊圖:
同樣的,如果分類數量太多。我們也可以將其優化成橫向柱狀圖。
3.時間序列相對關係:
展示隨著時間推移所產生的變化
成分相對關係和項目相對關係能展示在同一時間點上的相互關係。而時間序列相對關係則能夠展示出隨著時間變化而變化的關係。最好的闡釋時間序列相對關係的方式就是使用柱狀圖或折線圖。選擇使用哪一種,這取決於用哪一個比較方便。如果你的圖表中只有少數的幾個點,那麼柱狀圖會比較合適。反之,折線圖會更好。
3.1單個整體:
3.1.1一個分類只含有一個成分:
3.1.1.a折線圖與面積圖
在折線圖中,數據是遞增還是遞減、增減的速率、增減的規律、峰值等特徵都可以清晰地反映出來。所以,折線圖常用來分析數據隨時間的變化趨勢,也可用來分析多組數據隨時間變化的相互作用和相互影響。
遇到的問題:
1.當只有一條數據的時候,會出現整體空白太多的情況。所以在只有一條折線的時候,我們將折線圖優化成面積圖。提升視覺效果。
2.有的時候,我們為了追求視覺的美觀會將折線轉換成平滑曲線。
但是在某些特殊情況下,會造成輕微的誤解。
3.1.1.b柱狀圖
在某時間範圍內,當分類數量不是特別多的情況下,我們也可以使用柱狀圖來展示數值隨著時間推移所產生的變化。柱狀圖非常方便對臨近的數據進行大小的對比,但如果分類數量很多,推薦使用折線圖。
當你想要強調一個數據的特殊影響,可以考慮給他一個不同的顏色來形成對比。
同樣,我們可以將這種積極的數據與消極的數據用來展示數值的上升與下降。
遇到的問題:
在設計上面這個柱狀圖的時候,X軸的項目名稱擺放位置讓我糾結了很久。我認為項目名稱如果能夠更靠近柱子,會更方便用戶查看(下圖右)。但又沒能找到相關的實現手段或者案例,所以目前就這能擺在下方(下圖左)。如果在某一個時間點,消極的數據十分大,就會影響到用戶查看數據。(╯‵□′)╯︵┻━┻
3.1.2一個項目含有多個成分:
3.1.2.a堆疊面積圖
層疊面積圖上的最大的面積代表了所有的數據量的總和,是一個整體。各個疊起來的面積表示各個數據量的大小,這些堆疊起來的面積圖在表現數據分量的變化情況時格外有用。
3.1.2.b堆疊柱狀圖
同樣,在某時間範圍內,當項目數量不是特別多的情況下,我們也可以使用堆疊柱狀圖來展示數值隨著時間推移所產生的變化。但如果項目數量很多,推薦使用堆疊面積圖。
3.2多個整體:
3.2.1一個分類只含有一個成分:
3.2.1.a折線圖與面積圖:
設計的思考:
折線圖會出現上下交錯的情況,為了提升使用者的體驗,我們實驗性的在數據浮窗內增加了一個排序的功能。這樣就能夠和折線圖的高低順序對應起來,可以直接在數據浮窗內看到該時間點各項目的排名情況。但是否符合用戶的習慣,還需要更多時間驗證。
3.2.1.b柱狀圖:
相對來說柱狀圖的展示效果是不如折線圖的,但......我也不知道但什麼但,我就是想用這個圖不行嘛!(╯‵□′)╯︵┻━┻
3.2.2一個分類含有多個成分:
這是一個比較複雜的圖表,我覺得用語言概括這種情況有點讓人難以理解~【其實是我自己說不清楚( ̄ε(# ̄)☆╰╮( ̄▽ ̄///)】所以我還是舉個栗子吧。
經過一番折騰,有了下面兩張圖:
4.頻率分布相對關係:
展示各有多少項歸入一列數值範圍之內
一個頻率分布相對關係展示的是有多少分類(頻率)會落入一個具有特徵的數據段當中(分布)。這種類型的相對關係有兩種主要的應用,第一種是在所有樣本中進行歸納。第二種在商業陳述及報告中經常被用到,就是總結大量的數據來幫助證明一些有意義的關係。
4.1單個整體:
4.1.a柱狀圖:
4.2多個整體:
4.2.a分組柱狀圖:
5.相關性相對關係:
推薦閱讀:
※[小心得]環形布局(Circle Layout)圖
※近期在映電影選擇指南
※像製作人一樣思考——電影數據分析
※天池公益雲圖可視化大賽銅獎
※BOSS直聘行業信息爬取與分析(二)
TAG:數據可視化 |