從桑基圖的一些展開分析

@POINT小數點數據 北京場第四周的作業是桑基圖,在此基礎上,我根據自己的想法做了些展開。

原始數據是這樣的:

包括現有品牌、來源品牌和設備量三個欄位,我們能知道消費者在不同品牌中的選擇變化和數量。類型欄位是為做桑基圖路徑準備的。

做數據分析的一大難題,是在眾多可能性中,不知道朝哪個方向走最有價值。這次練習數據欄位少,反而幫了我大忙,少了選擇的煩惱。

雖然數據是關於手機行業的,但對品牌本身來講,客戶有進有出,可以化用互聯網常用的留存和新增來闡述。這樣就定出了基本的思路:

1、各品牌在來源和現有的佔比、前後佔比變化;

2、從來源到現有的留存情況(整體和品牌維度);

3、現有品牌的新客戶流入;

4、重磅:桑基圖,清楚展示品牌具體流動方向和數量;

5、故事怎麼展開,結論怎麼總結?

主意打定,接下來就是5個方向具體操作了。

先從簡單的開始:

咦,留存居然只有11%,這和我印象中品牌粉絲翹首以盼新機型不一樣啊,而且留存最高的居然OPPO。覺得這個結論還蠻有價值,就把標題從「餅圖」改成「89%的消費者……」強調一下。這時覺得故事也開始有點眉目了。

思路2、3的留存和新增的幾個圖基本都是在條形圖和餅圖之間嘗試做了一下。覺得能清楚表達構思的就留下,最後在加入儀錶板時,根據布局調一調方向和顏色。

但同時表現各品牌佔比大小和前後變化,就比較頭疼了。

佔比選餅圖是很自然的。餅圖的最初結果是這樣的:

看見左側的餅圖時,我的第一反應是:花皮球!是的,現有品牌的佔比差異不夠明顯,而且沒辦法很直觀的看出從來源到現有的增減變化。

正好看到 @Card Josh 分組條形圖的做法的分享,鏈接:Tableau 設計 | 創建分組條形圖,果斷模仿。放棄了來源品牌佔比餅圖,又對現有品牌餅圖加入留存和新增,升級成雙層餅圖。分組條形和餅圖結合起來,算是能比較清楚的看到各品牌的佔比大小和變化了。

再加入做好的桑基圖:

到這裡,tableau分析報告的基本骨架就出來了,後面就是愉快的優化布局,豐滿故事了。

故事引入

基本結論

儀錶板布局這塊,到目前為止,我總結出的基本經驗是:

1)空間上,要突出重點,讓最重要的信息 最早映入觀者的眼帘,並能很快了解在講什麼。這時候觀者和儀錶板的距離感消失,再愉快地瀏覽一下儀錶板里的次級信息,就能實現一次比較完整的信息傳遞了。tableau官網就有用戶觀看儀錶板的動眼跟蹤,可以參考一下。

注意留白。我剛開始做tableau儀錶板,會有種小孩子獻寶的心情,把自己能想到的,能做到的,統統加上去,感覺好豐富美美噠!但是,換成一個第一次看儀錶板的人,他是什麼感覺?要知道,他並不像我一樣,知道每個圖表的來龍去脈,前世今生。所以,剔除不必要的信息,留下給眼睛休息的空間。

2)顏色上,和很多時尚帖子里的顏色搭配很相似。先確定基礎主色調,同色系不同深淺搭配比較和諧,互補色強對比更抓眼這些。根據呈現需要,選擇是協調還是撞色,比如做散點圖時就適合強對比的撞色。

3)還有之前完全沒想到的點,儀錶板在瀏覽器和手機屏幕上的呈現效果不同。電腦上還OK的東西,手機上很可能慘不忍睹,所以對大小、字體都要注意,謹記謹記!

其實,在tableau public有很多優秀的作品,可以下載來觀摩。這點還是多虧 @路人甲老師在如何學習tableau里的提醒。

這些是我的一點小心得,也是我希望自己能更好做到的地方。

任何事情都有內在規律和特徵,tableau的使用,我相信也是如此!

知乎第一篇,獻給給了我很大幫助的 @POINT小數點數據 和各位老師,謝謝!


題圖來源:2016手機江湖:老面孔三起三落,新模式如日中天 -百家號


推薦閱讀:

最火熱的電動汽車,背後站的都是誰?
ggplot2多維分面多圖層對應規則
東易日盛:技術與數據,驅動傳統家裝行業效率和用戶體驗提升
隨機森林——二元分類的利器之Kaggle初體驗Titanic: Machine Learning from Disaster
Python數據分析及可視化實例之SKlearn訓練結果持久化保存

TAG:数据分析 | TABLEAU |