數據可視化:打造高端的數據報表
本文是《如何快速成為數據分析師》的第五篇教程,如果想要了解寫作初衷,可以先行閱讀七周指南。溫馨提示:如果您已經熟悉數據可視化,大可不必再看這篇文章,或只挑選部分。
前一篇文章列舉了常用的分析圖表,今天主要圍繞Excel常用的圖表技巧,以及圖表的設計規範展開。相信大家練習後,圖表設計能力會從下圖:
進化到:
數據分析師應該會設計圖表和報表。這裡並不是要求大家像設計師一樣運用Photoshop等軟體繪製,而是知道數據元素如何用圖表更好的表達,將數據蘊含的信息展現出來。理解數據是分析師的工作,展示數據也是分析師的工作。
對於非數據分析師的崗位,諸如運營、產品和市場,每天也會接觸大量的報表,日報周報項目報,用好圖表,讓枯燥的數據變成豐富的視覺,也是一種幫助。
重新認識圖表
好的數據可視化,應該設計和數據並存。數據分析師拿到很多數據,把它們像食材般加工成美味佳肴,但是菜色賣相不好,就讓人下不了筷子。可視化就是數據的色香味,也是溝通和彙報的工具。圖表給自己看,再難看也無所謂,如果需要彙報給領導和同事,美觀和易讀至少需要吧,不然大家怎麼了解你的分析成果。
今天的內容傾向於報表化圖表的製作,好的圖表應該有以下幾個要素:
可讀性
圖表的首要功能是解釋,而不是設計,尤其大部分圖表都會落入到過度設計的陷阱。
圖表設計,首先應該是沒有設計。
上圖是Excel老版本的默認模板,連直男也無法忍受的酷炫3D漸變陰影風。想當年小鮮肉的我也為此目眩神迷,給翠花完成PPT作業都是用得這類設計……然後就沒有然後了。
當我們使用這類圖表,反問一句,這些設計有必要麼?我們只需要用到柱形圖的對比,那麼陰影用來幹什麼?漸變用來幹什麼?背景黑色用來幹什麼?
這些元素對我們解讀數據沒有任何幫助,甚至會阻礙讀者閱讀數據。
其次,好的圖表要能解釋數據,不同圖表有不同的使用方法,如果我要觀察銷售額的增長,我就不應該用餅圖。如果數據量過少,就不應該使用散點圖。圖表如何使用可以看我的上一篇文章。
精準性
為了使數據的解讀不失真,數據應要求精確到小數位。12.5比12好,尤其在對比數據的情況下。數據若再近一步精確,對解讀的意義就不大,反而對解讀者進行干擾。
另外一種情況是單位換算造成的數據失真。例如3145米換算成3.1公里等,雖然是小細節,但不要出現某餅圖的各比例相加不等於100%的案例。
客觀性
數據的解讀因為每個人的觀點和視角不同,可以呈現諸多的結果。這也是我們常說統計學會撒謊的原因。
有經驗的數據分析師甚至能夠引導分析的結果。
下圖是一張銷售額柱形圖,看來銷售額沒有啥特大變化嘛。
我們換另外一種圖表展示。就看到了變化的增長趨勢。
實際上兩張圖表的數據沒有任何差異,為什麼呢?區別只在坐標軸。第一張圖的Y坐標軸起始為0,第二張圖起始是2.45。第二張是截取了部分的柱形圖。只是隨便動動手腳,數據表達就那麼大差異,看來數據分析師也可以是陰險角色啊。其他方法還有銷售額細分。看一下不同地區的增長,如果某幾個地區的增長好,就單獨拎出來作圖,美其名曰抽樣。
統一性
統一是規範和約束圖表,當圖表過多時,一個統一標準不會讓人眼花撩亂。
如果圖表整體顏色是冷色調,那麼就不要再加入暖色。
如果圖表文字是雅黑,就不要再加入宋體。
如果某地區數據,用了柱形圖對比,其他地區也遵循柱形圖樣式。
如果某圖表,女性使用紅色,男性使用藍色,那麼這一規範應該在所有圖表體現。除了顏色,其他設計元素同理。
如果有多張圖表,圖表元素應該統一,如標題、坐標軸刻度、坐標軸位置等。
統一性是為了可讀性服務的,如果圖表樣式混亂,解讀者會非常困惑。你做一份男女差異的數據報告,前面男性數據都用藍色表示,突然換個粉色誰會受得了?
後文的教程,都會遵循以上要素進行設計。
如何設計
好的配色決定了圖表整體美觀上限。一般只選取兩到三種顏色。過多的顏色無法聚焦於圖表本身,會讓圖表變得像瑪麗蘇。
配色屬於設計領域的技能,分析師就不要學怎麼搭配輔色對比色了。直接藉助Adobe Color CC的色彩主題選取顏色。
第一個配色方案不錯,高貴冷艷的商務風。後續圖表我們均用此配色方案,下面是十六制顏色編號:404B4F
82DFFFCEF2FF416F7FA5C2CC
利用rand( ) 函數隨機生成示範數據,生成一張默認的柱形圖。
比起酷炫3D漸變陰影風,Excel2016的默認圖表更易讓人接受,這張圖表在設計方面其實已經合格。不過男同胞若要為姑娘們的PPT和Excel排憂解難,我們得再深入設計。
首先將數據和圖表分離在兩張sheet,方便設計。
新sheet背景塗成灰色,記住是灰色。灰色是一種中立的顏色,它和任何顏色結合都不會顯得突兀。
接下來就是砍砍砍時間,我們將圖表上所有與數據表達無關的元素全部刪除:銷售額標題移除、背景色設置為透明,柱形圖顏色調整為配色方案。
很多人會疑問,為什麼連標題、背景色都要刪除。它和word的原理近似:設計樣式和內容分離。圖表只需要聚焦於數據表達本身。標題可以通過Excel的單元格添加,別用圖表的元素。對第一列單元格顏色填充,拉高,開頭空兩格,輸入配色文字。
此時標題的設計比圖表自帶標題不知道好看到哪裡去了。旁邊的單元格可以配上文字注釋,輔助閱讀者理解。設計的核心思路是通過單元格完善圖表,圖表只專註數據元素。
更優秀的報表,會加入重點數據,引入更多圖表,用顏色劃分區塊,每一區塊對應相應的數據內容,使之具有Dashboard的雛形。因為時間有限,就不更多展開了(上海我直接複製的)。熟練後製作這樣的報表大約只要5分鐘,但是對數據內容產生的隱性價值是不可估量。多補充一點,如果設計過程中圖表大小位置因為單元格一直變化。可以在選項中選擇固定大小和固定位置,方便設計。
PPT和Excel是通用的,以上設計方法也適用在PPT中,相信大家已經了解怎麼設計出商務范的報表。大家可以參考Excel2016的默認模板,都是出彩的設計。我希望大家看到這裡,能了解Excel圖表和報表的設計原理,但日後不要陷入一味追求美觀的道路。圖表是最終結果的呈現,作為報告讓它美觀無可厚非,但是在分析過程中,馬馬虎虎也就得了,畢竟自己看。在我的工作場景中,除了有需要,我也不會專門設計這類報表。
另外悄悄告訴大家,不要展示太牛逼的圖表設計技巧,不然以後老闆都會讓你設計的……
ok,了解完圖表和報表設計,接下來講解中高級技巧。
複合圖表
複合圖表和次坐標軸堪稱圖表屆的vlookup。它能給圖表添加更豐富的視覺表達。
前文中我增加了利潤數據,現在我們需要計算利潤的變化趨勢。因為利潤和銷售額不是同一個維度,再用柱形圖不合適,此時可以用折線圖表達。
點「選擇數據」,添加利潤,Y軸選取利潤所在數據區域。
這時候橙色就是添加上的利潤。我們點擊橙色柱形圖,右鍵更改圖表類型為折線圖。
更改配色,雖然橙色也挺好看的。線條也改為平滑。
點擊折線圖,選擇坐標軸系列選項,點次坐標軸。可以看到圖表兩邊都出現了坐標刻度。左邊是利潤刻度,右邊是銷售額刻度,但在不做說明的情況下閱讀者根本不會了解。為了可讀性,需要額外的增加元素說明。這又無形中增加了設計複雜度。所以圖表的元素取捨有多方面的考慮因素。
輔助列
如果複合圖表及次坐標軸堪稱圖表屆的vlookup,那麼輔助列就是圖表的數據透視表。
在我之前的文章(這篇文章在微信公眾號,感興趣可以看,以後抽空補上),裡面甘特圖的繪製藉助了輔助列。
這裡講解如何利用輔助列繪製漏斗圖。
下圖是牛逼逼有限公司電商APP的銷售流程轉化,每一行代表用戶操作類型和對應達成的用戶數。
漏斗圖的本質是堆積條形圖。我們增加兩個輔助列,計算方式為(最大用戶數-當前用戶數)/2。
將列順序更改為輔助列1,用戶數,輔助列2的排序。然後新建圖表為橫向堆積條形圖。相信在這裡大家已經看出輔助列的作用了。形狀出來了,接下來我們還需要幾步操作。點擊Y軸,選擇設置坐標軸格式,逆序類別上打上勾。
圖表成功翻轉,將左右兩邊的條形圖顏色設置為無。對圖表元素砍砍砍,只保留核心元素。接下來我們將圖表放到報表上,進行適當的裝飾,搞定輔助線
輔助線和輔助列不一樣,輔助線是圖表附加的元素。輔助線能繪製高級圖表。
甘特圖在項目管理中用來統籌時間進度。如果我需要在現有的圖表基礎上增加原計劃實際計劃,應該怎麼做?下圖是牛逼逼公司在其APP上準備的雙十二促銷活動計劃表。如何直觀的用甘特圖表示活動進度?
先增加一列輔助列。該列輔助列用於後續定位。數值等值增加即可。選擇計劃開始時間和輔助列,插入圖表,帶折線的散點圖(只選數字即可,不要選自段名)。現在看不出這是甘特圖,不要緊,對Y軸進行逆序排列。點擊圖表的添加元素,增加誤差線-標準誤差,誤差線就是我們的輔助線。
誤差線是高級圖表經常用到的功能,箱線圖、標靶圖/子彈圖都能用誤差線做出來。下圖十字狀的線條就是誤差線。選擇橫向的水平誤差線,點擊設置格式,方向正誤差,無線端,誤差值自定義,選擇計劃使用時間這一列。
刪除垂直誤差線,對誤差線線條加粗,設置顏色。現在有一點甘特圖的樣子了。點擊圖表選擇數據,新增加一個系列,數據源選擇實際開始時間和輔助列(在最開始建立散點圖時,其實可以一併選擇的)。點擊橙色這條線,重複誤差線的建立。在自定義值時,不要選擇計劃使用時間,而是實際完成時間。設置線條顏色的時候,用另外一種顏色和樣式,以便區分。
之後將橙色和藍色填充為無,移除無用的設計元素。我們把甘特圖放到報表中。因為時間關係,甘特圖還是缺漏部分說明元素的。大家有興趣可以自己嘗試添加。很多諮詢公司圖表就是這樣畫的。誤差線是一種高級用法,在高級的可視化分析中我們會利用誤差線進行一系列的分析,在後續的章節內容中我們會再次學習。
最終這幅報表就是成果,不知道大家有沒有掌握。其實Excel還有更強大的功能,比如切片,比如動態圖表,比如各插件,通過一系列的組合可以做出半自動報表,像財務報表、諮詢公司報表,都有各自的風格,大家可以網上查詢學習。
下節課將教大家BI,繪製真正的Dashboard。如果大家的工作涉及到很多excel和分析,那麼你會上升到新的台階。下圖是範例。
——————
歡迎大家關注我的微信公眾號:tracykanc
定期分享運營或數據的內容
推薦閱讀:
※老羅不跟羅振宇玩了,8月最好看的電影 | 數據周報
※揭開R語言中環境空間的神秘面紗
※數據學習之路—每周好文分享(第二期)
※【數據處理】dplyr包(下)
※防止爬蟲採集數據的框架或者策略有哪些?
TAG:MicrosoftExcel | Excel图表绘制 | 数据分析 |