圖說可視化,報表也能做得如此酷炫!
1、數據可視化概述
1.1、數據可視化的作用
數據可視化是指將數據通過圖表的方式傳遞出來,讓用戶能夠快速、準確地理解信息所要表達的內容,從而提高溝通效率。數據可視化的作用主要有:
1)傳遞更多的信息,一張圖能夠傳遞的信息可能需要長篇大論才能寫清楚,如你要描述最近一年公司收入情況,那你就需要說明每個月收入是多少,同比、環比增幅是多少,收入最多、最少的是哪個月,同比、環比增幅最低、最高的是哪個月等,而你用圖表表示則只需要一個柱狀圖和折線圖的組合圖表,就能準確表達上面的信息。
2)形象生動,便於理解,圖表通過更簡單的邏輯和視覺體驗,能夠讓用戶快速把握要點,就像前面的例子一樣,通過圖表,我們能夠一眼看哪個月的收入最高,而不用將每個數字放到大腦中比較,半天都得不出結果。
隨著大數據行業的發展,用戶對數據可視化的要求越來越高,好的可視化能力能夠使用戶更快的理解所要表達的內容,更加形象生動。所謂「字不如表,表不如圖」,圖表的重要性可見一斑,在統計分析產品、用戶畫像等數據產品上,都需要具備優秀的數據可視化能力。現在常見的如「一圖看懂XXX」等,都是用圖表來傳遞信息,是典型的數據可視化成果。
而在企業生產經營過程中常常出現的報表,也不再是原本那樣單一枯燥。就下圖帆軟報表FineReport的可視化來看,報表也可以做得如可視化信息圖一樣直觀易懂。(為什麼知乎不支持GIF動圖,大家自行看demo吧 數據決策系統)
接下來就來講講常見的可視化圖表,如何做出酷炫的報表!
1.2、圖表的分類
1)趨勢類圖表:通過圖表反映事物發展趨勢,能夠一眼看清楚走向和大勢,如隨時間變化趨勢,常見圖表為柱形圖、折線圖、面積圖。
2)對比類圖表:通過對比發現不同事物間的差異和差距,從而總結事物特徵,如某兩個人的對比,一個更帥,一個更有錢,常見圖表為雙柱形圖、雙摺線圖、雙條形圖、雙面積圖、雷達圖。
3)構成類圖表:通過不同的面積大小、長短等反映事物的結構和組成,從而知道什麼是主要的、什麼是次要的,常見圖表為餅圖、圓環圖、樹狀圖、旭日圖、瀑布圖。
4)分布類圖表:通過圖表反映事物的分布、佔比情況,從而知道事物的分布特徵、不同維度間的關係等,常見圖表為散點圖、直方圖、氣泡圖、詞雲、熱力圖。
5)地圖類圖表:通過地圖反映事物地理分布情況或用戶出行軌跡(地圖其實可以算是分布的一種,因為其是一類很重要的可視化圖表,所以單獨列出),常見圖表為全球地圖、中國地圖、省市地圖、街道地圖、地理熱力圖等。
當然,圖表大多都不是單個獨立存在的,而是各類圖表組合在一起的,從而能夠傳遞更多的信息,並能提供一種整合的視角,不用用戶不斷的對比多個圖表,組合圖表是現實中使用得更多的。如既要表達趨勢又要表達構成,則可以使用堆積柱形圖、百分比堆積柱形圖、堆積條形圖、百分比堆積條形圖等;要同時體現絕對值和增長率,則可以使用柱形圖和折線圖的組合圖形;要反映某個構成部分的組成,則可以使用複合餅圖。
1.3、常用圖表
如上所述,圖表主要分為五類,常用的圖表包括柱狀圖、折線圖、餅圖、散點圖、雷達圖等,以下為一些常見的圖表。
1.3.1、柱狀圖
柱狀圖中還包括與其類似的條形圖、瀑布圖、直方圖等,主要是為了反映事物的變化趨勢、分布情況、規模情況等。
柱狀圖可以按照時間繪製,反映事物變化趨勢,如某個指標最近一年變化趨勢,也可以按照其它維度繪製,如區域、機型、版本等,反映事物的分布情況。
條形圖是將柱狀圖垂直放置,整體跟柱狀圖差不多,但是換了一個視角。
瀑布圖能夠反映事物從開始到結束經歷了什麼過程,用於分解問題原因或事物構成因素特別好用,如上月收入是怎麼變成本月收入的,就可以通過瀑布圖分解每一個收入組成部分所做的貢獻,找出哪一組成部分提升了收入,哪一組成部分降低了收入。
直方圖反映事物的分布情況,可以看出事物主要集中在哪裡,如查看付費用戶付費金額分布等。
1.3.2、折線圖
折線圖是點和線連在一起的圖表,可以反映事物發展趨勢和分布情況,與柱狀圖相比,更適合代表增幅、增長值,而不太適合代表絕對值。
面積圖就是在折線圖下加上陰影面積,也主要是為了反映事物發展趨勢和分布情況。
1.3.3、餅圖
餅圖是將一個圓餅分為幾份,用來反映事物的構成情況,類似圖表還包括環圖、旭日圖等。旭日圖有多個圓環,可以直觀的顯示事物組成部分下一層次的構成情況,比如某個省分為幾個市,每個市下面又有幾個縣、每個縣下面又有幾個鎮,就是將事物層層分解。
1.3.4、散點圖
散點圖是事物兩個維度的交叉分布情況,反映不同維度間的關係,如不同產品在市場佔有率、預期增長率兩個維度間的分布情況,很多二維矩陣就是通過散點圖來實現的,以兩個維度的平均值作為分割線,如常見的波士頓矩陣。通過散點圖我們可以看出不同事物間是怎麼交叉分布的,它們之間有什麼關係,是正相關、負相關或隨機分布。
類似的圖表還有氣泡圖,氣泡圖還可以通過氣泡麵積的大小表示值的大小,相對於散點圖來說多了一個維度,如前面不同產品的例子,氣泡的大小可以代表各產品營收的多少。
1.3.5、雷達圖
雷達圖主要表達事物在各個維度上的分布情況,從而可以看出事物在什麼地方強、什麼地方弱。比如一個學生各個學科的得分,就可以通過雷達圖清晰表達出來,用戶能夠一眼看出這個學生哪一科強、哪一科弱,又如一個產品在各個評價維度上的評分。
1.3.6、地圖
地圖可以形象的反映事物在地理上的分布情況以及人員遷徙情況,主要包括地理分布圖(全球、全國、各省市等)、遷徙圖、熱力地圖(省市、街道等)等。
1.3.7、樹狀圖
樹狀圖主要是為了反映事物的構成情況,相對於餅圖的優點是,樹狀圖可以更清晰的顯示更多組成部分,比如餅圖可能組成部分多於8個就顯得很擠,而且佔比小的就很不清晰,但是樹狀圖卻不會,它能夠充分利用區域面積。
1.3.8、漏斗圖
漏斗圖主要用來反映關鍵流程各個環節轉化情況,讓用戶能夠一眼看清整個流程轉化情況,如常見的電商購物轉化流程,從瀏覽商品-添加進購物車-生成訂單-支付訂單-交易完成等一連串購買流程。下面是手游的轉化漏斗圖,通過分析各個步驟的轉化率,能夠發現問題所在,找准改進方向。
1.3.9、詞雲圖
詞雲圖是為了描述事物的主要特徵,如一個人主要特徵是什麼,高、帥、富,或者其它,能夠讓人一眼看出一個事物的主要特徵,越明顯的特徵越要突出顯示。同時,還有象形的詞雲圖,如輪廓是一個人、一隻鳥等,用以反映事物主題,從而更加形象生動。
1.3.10、熱力圖
熱力圖主要是反映地理、點擊熱力分布情況,從而看出哪裡是人群最多的地方、哪裡是用戶點擊最多的地方等,可以反映用戶出行習慣、使用習慣等。
1.3.11、組合圖表
絕大多數圖表都不是單獨存在的,都是多類型的圖表組合在一起的,這樣才能夠傳遞更多的信息,提供綜合的視角。如我們想看到不同事物間的對比,則我們可以使用雙柱圖、雙摺線圖、雙雷達圖、雙環圖等,可以清晰表達不同事物在不同維度上的對比情況。
1.4、圖表配色
圖表配色在數據可視化中是很重要的元素,有了合適的圖表,還要有合適的的配色,才能讓人看著舒服,就像你有一件很有范兒的衣服,還也必須有適合的顏色搭配。恰當的配色主要有兩個作用:1)突出主題,讓用戶清晰知道圖表主要想要表達的意思,如對重點內容用深色標註;2)讓人看著舒服,整個圖表色彩很和諧,不會讓人感到突兀,如五顏六色的。
圖表配色的原則主要有:
1)圖表配色不能太花,一張圖表超多七種顏色則不是很恰當,容易分散讀者注意力,最好是同一色系的,可以通過調整透明度來設置)。
2)圖表配色要重點突出,想要主要呈現的事物或指標用亮色呈現,其它次要事物或指標可以用更淡一些的顏色。
2、數據可視化工具
Excel
Excel應該是使用最廣泛的可視化工具,包含基本所有常用的圖表,新版Excel裡面有地圖、旭日圖、瀑布圖等。
Echarts
Echarts是百度的可視化圖表插件,已經被廣泛使用在一些可視化平台的開發。
推薦閱讀:
※有一個傳奇叫:周杰倫! 大數據分析後的周杰倫就是這麼牛 但是有人卻質疑他
※四個動畫秒懂 Apache Beam 模型
※Kaggle Titanic項目代碼精簡版(排名1307)
※運用小數據逆襲,一家地區超市讓沃爾瑪甘拜下風
※如何用深度學習進行CT影像肺結節探測(附有基於Intel Extended Caffe的3D Faster RCNN代碼開源)