數據可視化:打造高端的數據報表

本文是《如何快速成為數據分析師》的第五篇教程,如果想要了解寫作初衷,可以先行閱讀七周指南。溫馨提示:如果您已經熟悉數據可視化,大可不必再看這篇文章,或只挑選部分。

前一篇文章列舉了常用的分析圖表,今天主要圍繞Excel常用的圖表技巧,以及圖表的設計規範展開。相信大家練習後,圖表設計能力會從下圖:

進化到:

數據分析師應該會設計圖表和報表。這裡並不是要求大家像設計師一樣運用Photoshop等軟體繪製,而是知道數據元素如何用圖表更好的表達,將數據蘊含的信息展現出來。理解數據是分析師的工作,展示數據也是分析師的工作。

對於非數據分析師的崗位,諸如運營、產品和市場,每天也會接觸大量的報表,日報周報項目報,用好圖表,讓枯燥的數據變成豐富的視覺,也是一種幫助。

重新認識圖表

好的數據可視化,應該設計和數據並存。數據分析師拿到很多數據,把它們像食材般加工成美味佳肴,但是菜色賣相不好,就讓人下不了筷子。可視化就是數據的色香味,也是溝通和彙報的工具。圖表給自己看,再難看也無所謂,如果需要彙報給領導和同事,美觀和易讀至少需要吧,不然大家怎麼了解你的分析成果。

今天的內容傾向於報表化圖表的製作,好的圖表應該有以下幾個要素:

可讀性

圖表的首要功能是解釋,而不是設計,尤其大部分圖表都會落入到過度設計的陷阱。

圖表設計,首先應該是沒有設計。

上圖是Excel老版本的默認模板,連直男也無法忍受的酷炫3D漸變陰影風。想當年小鮮肉的我也為此目眩神迷,給翠花完成PPT作業都是用得這類設計……然後就沒有然後了。

當我們使用這類圖表,反問一句,這些設計有必要麼?我們只需要用到柱形圖的對比,那麼陰影用來幹什麼?漸變用來幹什麼?背景黑色用來幹什麼?

這些元素對我們解讀數據沒有任何幫助,甚至會阻礙讀者閱讀數據。

其次,好的圖表要能解釋數據,不同圖表有不同的使用方法,如果我要觀察銷售額的增長,我就不應該用餅圖。如果數據量過少,就不應該使用散點圖。圖表如何使用可以看我的上一篇文章。

精準性

為了使數據的解讀不失真,數據應要求精確到小數位。12.5比12好,尤其在對比數據的情況下。數據若再近一步精確,對解讀的意義就不大,反而對解讀者進行干擾。

另外一種情況是單位換算造成的數據失真。例如3145米換算成3.1公里等,雖然是小細節,但不要出現某餅圖的各比例相加不等於100%的案例。

客觀性

數據的解讀因為每個人的觀點和視角不同,可以呈現諸多的結果。這也是我們常說統計學會撒謊的原因。

有經驗的數據分析師甚至能夠引導分析的結果。

下圖是一張銷售額柱形圖,看來銷售額沒有啥特大變化嘛。

我們換另外一種圖表展示。就看到了變化的增長趨勢。

實際上兩張圖表的數據沒有任何差異,為什麼呢?區別只在坐標軸。第一張圖的Y坐標軸起始為0,第二張圖起始是2.45。第二張是截取了部分的柱形圖。

只是隨便動動手腳,數據表達就那麼大差異,看來數據分析師也可以是陰險角色啊。其他方法還有銷售額細分。看一下不同地區的增長,如果某幾個地區的增長好,就單獨拎出來作圖,美其名曰抽樣。

統一性

統一是規範和約束圖表,當圖表過多時,一個統一標準不會讓人眼花撩亂。

如果圖表整體顏色是冷色調,那麼就不要再加入暖色。

如果圖表文字是雅黑,就不要再加入宋體。

如果某地區數據,用了柱形圖對比,其他地區也遵循柱形圖樣式。

如果某圖表,女性使用紅色,男性使用藍色,那麼這一規範應該在所有圖表體現。除了顏色,其他設計元素同理。

如果有多張圖表,圖表元素應該統一,如標題、坐標軸刻度、坐標軸位置等。

統一性是為了可讀性服務的,如果圖表樣式混亂,解讀者會非常困惑。你做一份男女差異的數據報告,前面男性數據都用藍色表示,突然換個粉色誰會受得了?

後文的教程,都會遵循以上要素進行設計。

如何設計

好的配色決定了圖表整體美觀上限。一般只選取兩到三種顏色。過多的顏色無法聚焦於圖表本身,會讓圖表變得像瑪麗蘇。

配色屬於設計領域的技能,分析師就不要學怎麼搭配輔色對比色了。直接藉助Adobe Color CC的色彩主題選取顏色。

第一個配色方案不錯,高貴冷艷的商務風。後續圖表我們均用此配色方案,下面是十六制顏色編號:

404B4F

82DFFF

CEF2FF

416F7F

A5C2CC

利用rand( ) 函數隨機生成示範數據,生成一張默認的柱形圖。

比起酷炫3D漸變陰影風,Excel2016的默認圖表更易讓人接受,這張圖表在設計方面其實已經合格。不過男同胞若要為姑娘們的PPT和Excel排憂解難,我們得再深入設計。

首先將數據和圖表分離在兩張sheet,方便設計。

新sheet背景塗成灰色,記住是灰色。灰色是一種中立的顏色,它和任何顏色結合都不會顯得突兀。

接下來就是砍砍砍時間,我們將圖表上所有與數據表達無關的元素全部刪除:銷售額標題移除、背景色設置為透明,柱形圖顏色調整為配色方案。

很多人會疑問,為什麼連標題、背景色都要刪除。它和word的原理近似:設計樣式和內容分離。圖表只需要聚焦於數據表達本身。標題可以通過Excel的單元格添加,別用圖表的元素。

對第一列單元格顏色填充,拉高,開頭空兩格,輸入配色文字。

此時標題的設計比圖表自帶標題不知道好看到哪裡去了。旁邊的單元格可以配上文字注釋,輔助閱讀者理解。設計的核心思路是通過單元格完善圖表,圖表只專註數據元素。

更優秀的報表,會加入重點數據,引入更多圖表,用顏色劃分區塊,每一區塊對應相應的數據內容,使之具有Dashboard的雛形。

因為時間有限,就不更多展開了(上海我直接複製的)。熟練後製作這樣的報表大約只要5分鐘,但是對數據內容產生的隱性價值是不可估量。多補充一點,如果設計過程中圖表大小位置因為單元格一直變化。可以在選項中選擇固定大小和固定位置,方便設計。

PPT和Excel是通用的,以上設計方法也適用在PPT中,相信大家已經了解怎麼設計出商務范的報表。大家可以參考Excel2016的默認模板,都是出彩的設計。

我希望大家看到這裡,能了解Excel圖表和報表的設計原理,但日後不要陷入一味追求美觀的道路。圖表是最終結果的呈現,作為報告讓它美觀無可厚非,但是在分析過程中,馬馬虎虎也就得了,畢竟自己看。在我的工作場景中,除了有需要,我也不會專門設計這類報表。

另外悄悄告訴大家,不要展示太牛逼的圖表設計技巧,不然以後老闆都會讓你設計的……

ok,了解完圖表和報表設計,接下來講解中高級技巧。

複合圖表

複合圖表和次坐標軸堪稱圖表屆的vlookup。它能給圖表添加更豐富的視覺表達。

前文中我增加了利潤數據,現在我們需要計算利潤的變化趨勢。因為利潤和銷售額不是同一個維度,再用柱形圖不合適,此時可以用折線圖表達。

點「選擇數據」,添加利潤,Y軸選取利潤所在數據區域。

這時候橙色就是添加上的利潤。我們點擊橙色柱形圖,右鍵更改圖表類型為折線圖。

更改配色,雖然橙色也挺好看的。線條也改為平滑。

利潤和銷售額的數值在同一個度量範圍,可以共用坐標軸。如果利潤數值過小,比如零點幾,或者30%這種比例,那麼在圖表上會近似一條平緩的直線,視覺表達欠佳。本圖的數據類型我不建議用次坐標軸。

點擊折線圖,選擇坐標軸系列選項,點次坐標軸。可以看到圖表兩邊都出現了坐標刻度。左邊是利潤刻度,右邊是銷售額刻度,但在不做說明的情況下閱讀者根本不會了解。為了可讀性,需要額外的增加元素說明。這又無形中增加了設計複雜度。所以圖表的元素取捨有多方面的考慮因素。

輔助列

如果複合圖表及次坐標軸堪稱圖表屆的vlookup,那麼輔助列就是圖表的數據透視表。

在我之前的文章(這篇文章在微信公眾號,感興趣可以看,以後抽空補上),裡面甘特圖的繪製藉助了輔助列。

這裡講解如何利用輔助列繪製漏斗圖。

下圖是牛逼逼有限公司電商APP的銷售流程轉化,每一行代表用戶操作類型和對應達成的用戶數。

漏斗圖的本質是堆積條形圖。我們增加兩個輔助列,計算方式為(最大用戶數-當前用戶數)/2。

將列順序更改為輔助列1,用戶數,輔助列2的排序。然後新建圖表為橫向堆積條形圖。相信在這裡大家已經看出輔助列的作用了。

形狀出來了,接下來我們還需要幾步操作。點擊Y軸,選擇設置坐標軸格式,逆序類別上打上勾。

圖表成功翻轉,將左右兩邊的條形圖顏色設置為無。對圖表元素砍砍砍,只保留核心元素。

接下來我們將圖表放到報表上,進行適當的裝飾,搞定

輔助線

輔助線和輔助列不一樣,輔助線是圖表附加的元素。輔助線能繪製高級圖表。

甘特圖在項目管理中用來統籌時間進度。如果我需要在現有的圖表基礎上增加原計劃實際計劃,應該怎麼做?下圖是牛逼逼公司在其APP上準備的雙十二促銷活動計劃表。如何直觀的用甘特圖表示活動進度?

先增加一列輔助列。該列輔助列用於後續定位。數值等值增加即可。

選擇計劃開始時間和輔助列,插入圖表,帶折線的散點圖(只選數字即可,不要選自段名)。

現在看不出這是甘特圖,不要緊,對Y軸進行逆序排列。點擊圖表的添加元素,增加誤差線-標準誤差,誤差線就是我們的輔助線。

誤差線是高級圖表經常用到的功能,箱線圖、標靶圖/子彈圖都能用誤差線做出來。下圖十字狀的線條就是誤差線。

選擇橫向的水平誤差線,點擊設置格式,方向正誤差,無線端,誤差值自定義,選擇計劃使用時間這一列。

刪除垂直誤差線,對誤差線線條加粗,設置顏色。現在有一點甘特圖的樣子了。

點擊圖表選擇數據,新增加一個系列,數據源選擇實際開始時間和輔助列(在最開始建立散點圖時,其實可以一併選擇的)。

點擊橙色這條線,重複誤差線的建立。在自定義值時,不要選擇計劃使用時間,而是實際完成時間。設置線條顏色的時候,用另外一種顏色和樣式,以便區分。

之後將橙色和藍色填充為無,移除無用的設計元素。我們把甘特圖放到報表中。

因為時間關係,甘特圖還是缺漏部分說明元素的。大家有興趣可以自己嘗試添加。很多諮詢公司圖表就是這樣畫的。

誤差線是一種高級用法,在高級的可視化分析中我們會利用誤差線進行一系列的分析,在後續的章節內容中我們會再次學習。

最終這幅報表就是成果,不知道大家有沒有掌握。其實Excel還有更強大的功能,比如切片,比如動態圖表,比如各插件,通過一系列的組合可以做出半自動報表,像財務報表、諮詢公司報表,都有各自的風格,大家可以網上查詢學習。

下節課將教大家BI,繪製真正的Dashboard。如果大家的工作涉及到很多excel和分析,那麼你會上升到新的台階。下圖是範例。

——————

歡迎大家關注我的微信公眾號:tracykanc

定期分享運營或數據的內容


推薦閱讀:

老羅不跟羅振宇玩了,8月最好看的電影 | 數據周報
揭開R語言中環境空間的神秘面紗
數據學習之路—每周好文分享(第二期)
【數據處理】dplyr包(下)
防止爬蟲採集數據的框架或者策略有哪些?

TAG:MicrosoftExcel | Excel图表绘制 | 数据分析 |