桑基圖有何作用,桑基圖又是怎麼做出來的?


最近有好幾個用戶問到:桑基圖是怎麼做的?有教程嗎?可以提供一份模板數據嗎?那今天就教大家如何2步玩轉桑基圖咯!

1.那麼桑基圖到底是什麼呢?

  桑基圖(Sankey diagram),即桑基能量分流圖,也叫桑基能量平衡圖。它是一種特定類型的流程圖,圖中延伸的分支的寬度對應數據流量的大小,比較適用於用戶流量等數據的可視化分析。因1898年Matthew Henry Phineas Riall Sankey繪製的「蒸汽機的能源效率圖」而聞名,此後便以其名字命名為「桑基圖」。

  以上是百度百科的解釋,互聯網時代,經常用桑基圖進行網站用戶細分分析,如上圖,表示網站2015年1月-12月不同用戶的活躍程度(定義為低頻、中頻和高頻用戶)變化流程以及最終的累計情況,圖中流線的粗細象徵著用戶數的多少,數據十分直觀!

2.重點來了,如何快速製作桑基圖呢?

  目前了解到的桑基圖製作工具就有:BDP個人版、sankey、echarts、tableau、D3等工具,供大家參考。其他工具今天就不多說了,有興趣可以自己去找下相關的教程,今天就以分析用戶購買商品流程為例講一下如何利用wuliBDP來製作出高大上的桑基圖!

案例說明

  小粒開了一家零食網店,小粒在元旦期間借著節日做了一場滿減活動,在假期結束之後,小粒想要分析元旦活動期間顧客下單購買商品的情況。

任務分解

  1 )確定好要分析的維度和數值

  BDP中,桑基圖的圖表要求是2個維度和1個數值,案例中的維度:日期購買狀態,數值:顧客ID;

  2) 準備好的數據(部分數據如下圖)

  3)可視化分析

圖表說明

  以顧客(p0001、p0002和p0003,簡稱p1、p2和p3)為例說明:p1、p2和p3三人在1月1號時都處於將商品加入購物車的狀態;在2號的時候p3為已付款狀態,而p1和p2卻是處於下單狀態;在3號的時候p3為申請退款狀態,而p1和p2為付款狀態;

操作步驟

Step 1 :在「工作表」頁面上傳需要分析的工作表數據,或者直接選用資料庫或第三方平台的文件數據,在需要分析的工作表數據右上方點擊「新建圖表」;只要想要BDP進行分析,這步操作都少不了哦,相信大家都很熟悉了,就不多廢話啦~

Step 2: 在「編輯圖表」頁面,將需要分析的數據欄位分別拖拽至維度欄(案例中的日期和購買狀態)和數值欄(案例中的顧客ID)中,在右側圖表中選中「桑基圖」,並設置流程主體欄位(案例中的顧客ID),還可以根據喜好調整圖表的顏色(如下圖),一張高大上的桑基圖就完成啦,是不是很簡單呀??

小夥伴們,你們學會了嗎?有不懂的地方可以留言給我哈!桑基圖圖表參考:https://me.bdp.cn/share/index.html?shareId=sdo_667cd39c7baa7ee3e8e6ca97109ec6b0


桑基圖(Sankey diagram),即桑基能量分流圖,也叫桑基能量平衡圖。它是一種特定類型的流程圖,圖中延伸的分支的寬度對應數據流量的大小,通常應用於能源、材料成分、金融等數據的可視化分析。因1898年Matthew Henry Phineas Riall Sankey繪製的「蒸汽機的能源效率圖」而聞名,此後便以其名字命名為「桑基圖」。 桑基圖最明顯的特徵就是,始末端的分支寬度總各相等,即所有主支寬度的總和應與所有分出去的分支寬度的總和相等,保持能量的平衡。


推薦閱讀:

數據可視化的時候,前後端、資料庫是什麼關係。是通過什麼連接的?
做完數據分析後,用什麼可視化工具展示分析結果?
Python中除了matplotlib外還有哪些數據可視化的庫?
如何用Matplotlib讀取dat格式的文件並繪製出曲面圖?
參加山東大學可視計算暑期學校是怎樣一種體驗?

TAG:數據分析 | 數據可視化 | 可視化 | 圖表 | 圖表工具 |