如何選擇合適的圖形表達論文的數據結果?
做科研寫論文都會遇到的一個問題,實驗做出來的結果該用哪種形式的圖形可以清晰、明確、美觀地表達數據的含義?同一套數據,用不同的圖形,表達的重點可能不一樣了,該如何去選擇與思考?
謝邀。
好的數據可視化圖表可以達到「一圖勝千言」的效果。從William Playfair在18世紀首先創造了線圖、柱圖、餅圖與面積圖,到白衣天使南丁格爾為了說服維多利亞女王提升醫院護理條件與水平、降低英國士兵死亡率、從而發明了南丁格爾圖(也叫做玫瑰圖),我們現在已經擁有了各式各樣的圖表。甚至有的數據可視化工具會宣稱自己擁有「海量」圖表。
但是不能忘卻的是,每個圖表的創造過程,都是為了解決切實的問題,都是為了以最精確的方式來體現數據。不是用的圖表越蹊蹺、越特別就越好。相反,每一種圖表類型都有最適合自己的業務場景,合適的才是最棒的。
題主說的「同一套數據,用不同的圖形,表達的重點可能不一樣了」我特別贊同。其實圖表的類型應該=數據的類型。如果不等,大概很像把旗袍穿在猴子身上吧,既限制了猴子的靈活也難以展示旗袍之美,只是徒增怪異罷了。
ps:以下圖表所用工具:數據觀|新一代商業管理雲
[數據的五種關係]
首先,我們需要了解,數據通常包含五種相關關係:構成、比較、趨勢、分布及聯繫。
構成 主要關注每個部分所佔整體的百分比,如果你想表達的信息包括:「份額」、「百分比」以及「預計將達到百分之多少」,這時候可以用到餅圖;
比較 可以展示事物的排列順序——是差不多,還是一個比另一個更多或更少呢?「大於」、「小於」或者「大致相當」都是比較相對關係中的關鍵詞,這時候會首選條圖;
趨勢 是最常見的一種時間序列關係,關心數據如何隨著時間變化而變化,每周、每月、每年的變化趨勢是增長、減少、上下波動或基本不變,這時候使用線圖更好地表現指標隨時間呈現的趨勢;
分布 是關心各數值範圍內各包含了多少項目,典型的信息會包含:「集中」、「頻率」與「分布」等,這時候使用柱圖;同時,還可以根據地理位置數據,通過地圖展示不同分布特徵;
聯繫 主要查看兩個變數之間是否表達出我們預期所要證明的模式關係,比如預期銷售額可能隨著折扣幅度的增長而增長,這時候可以用氣泡圖來展示,用於表達「與……有關」、「隨……而增長」、「隨……而不同」變數間的關係。
對信息中包含的5種關係,可以簡單歸納如下:
構成:佔總體的百分比
比較:項目的排名
趨勢:如何隨著時間變化
分布:項目的頻率情況
聯繫:變數之間的關係
[圖表的具體適用場景]
下面,我們具體來看一下數據觀提供的圖表特點及適用場景:
條圖
條圖表達比較關係,按照強調的方式可以排列任何順序,適用於高亮Top3或Top5數據,如在零售行業中統計暢銷品的銷售情況就是很好的應用。它是最通用的一種圖表,應在所有的圖集使用中佔到25%。
柱圖
柱圖用高度反映數據差異,用來展示有多少項目(頻率)會落入一個具有一定特徵的數據段中,比如分析公司人員構成是否存在老齡化現象,可以通過柱圖看到25歲以下的員工有多少,25歲到35歲之間員工有多少等這種年齡的分布情況。同時,柱圖還可以用來表示含有較少數據值的趨勢變化關係。
分析圖形有單指標柱圖、多指標柱圖以及堆疊柱圖類型。
(1)、單指標柱圖
(2)、多指標柱圖(也叫做「分組柱圖」)
(3)、堆疊柱圖
線圖
線圖可用來反映隨時間變化而變化的關係,尤其是在趨勢比單個數據點更重要的場合。
在柱圖與線圖的選擇過程中,可以考慮數據的本質。柱圖強調的是數量的級別,它更適合於表現在一小段時間裡發生的事件,產量的數據很適合這個領域。線圖強調的是角度的運動及圖像的變換,因此展示數據的發展趨勢時最好使用它,存貨量就是一個很好的例子。柱圖和線圖的使用應佔到圖集看板的50%左右。
線圖類型中可以有單線圖,還可以在圖中進行多指標趨勢性比較。
(1)、單線圖
(2)、多指標趨勢性比較
餅圖
構成比例關係時,最好使用餅圖,給人一種整體的形象,可以展示每一部分所佔全部的百分比,比如產品A預計銷售額佔到所有產品銷售額的最大份額。
為了使餅圖盡量發揮作用,在使用中不宜多於6種成分。人的眼睛比較習慣於按順時針方向進行觀察,所以應該講最重要的部分放在緊靠12點鐘的位置,如果沒有哪一個部分比其他部分更加重要,那麼就應該考慮讓它們從大到小的順序排列。
數據觀除了有標準餅圖,還提供中空餅圖和環形餅圖兩種類型。
(1)、標準餅圖
(2)、中空餅圖(也叫圈圖)
(3)、環形餅圖
Attention!不適用餅圖的情況
餅圖是通過面積呈現數據的變化,當各指標所佔比例接近時,無法直觀的判斷面積的大小,此時選擇條圖來呈現,規律就更加清晰。餅圖是應最少使用的圖表,在所有的陳述和報告中其使用率應少於5%。
錯誤的圖表類型:
(這個長的也太像小時候玩兒的皮球了……)
正確的圖表類型:
氣泡圖
氣泡圖判斷兩個變數之間是否存在某種關係,可反映五維數據。每個氣泡的不同顏色或標籤,以及氣泡點大小,都可以反映一個維度。一般使用率為10%。
KPI圖
最直接顯示結果,適用於高亮關注指標值或者差異,可以通過主要指標和次要指標進行體現。信息量避免過多,越直觀越好。
面積圖
與折線圖較為類似,面積圖強調變數隨時間而變化的程度,也可用於引起人們對總值趨勢的注意。用填充了顏色或圖案的面積來顯示數據,面積片數不宜超過5片。
漏斗圖
漏斗圖用來表示逐層分析的過程,從一個總值(最頂端),不斷除去不關心的部分,最終得到關心的值的過程。
多用於業務流程比較規範、周期長、環節多的流程分析,通過比較各個環節寬窄大小,能夠直觀地發現和說明問題所在。常見應用場景:電商網站、營銷推廣、CRM等。
1)電商網站:通過轉化率比較能充分展示用戶從進入網站到實現購買的最終轉化率。 2)營銷推廣:反映搜索營銷的各個環節的轉化,從展現、點擊、訪問、諮詢,直到生成訂單過程中的客戶數量及流失。
3)CRM:銷售漏斗圖用來展示客戶各個階段轉化比較。
金字塔圖
金字塔圖用於展示類似金字塔的層級結構和數據量。例如某個國家的收入分配,金字塔頂部顯示高收入類別,逐漸降低到代表低收入的底部。
雷達圖
雷達圖可以用來表現一個周期數值的變化,也可以用來表現特定對象主要參數的相對關係。
雷達圖多用於在財務分析中,用來分析企業負債能力、運營能力、盈利和發展能力等指標。
地圖
地圖是信息密度最大的數據可視化方式,人們在日常生活中就使用地圖,所以能直觀理解地圖。
數據觀基於不同的視覺化原理提供三種地圖:區域地圖、散點地圖和熱力地圖。
(1)、區域地圖
區域地圖是按照國家、省市行政區劃分,用來展現地理信息,以及與地理位置有關的信息,指標的多少可以用顏色深淺區分。
(2)、散點地圖
散點地圖基於高德地圖實現,通過定位經緯度,用散點來表示所在位置的信息指標。
(3)、熱力地圖
熱力地圖以特殊高亮的形式顯示訪客所在的地理區域的圖示,不同顏色反映不同區域密度的分布。
表格
表格可以通過拖拽所關心的指標,如通過一級、二級分類,了解更加明細的數據,起到數據透視表功能。
綜合使用
餅圖、柱圖、條圖、線圖、氣泡圖可以組成可視化報告90%圖形,其他視覺化展示可以將圖表組合起來綜合使用。
推薦閱讀:
※歐特克(autodesk)的一個能查看信息的BIM雲端軟體是什麼?
※人際關係可視化圖譜相關軟體求推薦?
※中國好用的數據挖掘分析、數據可視化軟體?
※tableau server發布的儀錶盤,如何每隔5分鐘自動刷新一次獲取最新數據?
※什麼是數據可視化?