雨沐田:PowerPivot 用戶購買行為多表關聯分析
昨天用PowerPivot 導入某電商網站數據並進行了簡單分析:
雨沐田:PowerPivot分析用戶購買行為之數據準備+簡單分析
也演示了PowerPivot中創建數據透視表和數據透視圖的過程,那是相當的簡單。
之前的文章(雨沐田:初識Excel高級數據分析工具PowerPivot)說到PowerPivot能做什麼的時候,有重要一條就是 「不同數據之間創建關係」,今天我就重點說說這個關係!
這個關係不止在一個地方出現,之前說到常見的資料庫都是關係型資料庫;昨天說到數據模型,講到數據模型是數據、關係、邏輯等的綜合體;這個關係是無處不在~
1、如何理解關係?
2、關係如何表現?
3、關係如何利用?
現實世界中
父母和子女之間是一種關係
老師和學生之間是一種關係
好基友也是一種關係~~
在網站購物,你和網站就產生了關係~
......
關係無處不在,所謂關係就是一種特定的關聯。
如果將現實世界信息化、數據化,這些關係也是不能丟的,也要以特定的方式表現出來,而這種關係的表現方法,是我們需要重點了解的。
現實中各種關係存儲為數據後,就變成了數據之間的關係,而數據之間的關係還是一個具體的數據。
如:
你的個人信息、教育經歷、醫療記錄等等被存儲的不同的系統中,雖然是相互獨立的,但還是一個關係體,而將這些數據關聯起來的必然是你的唯一標識,即你的身份證號碼。
有了身份證號碼,能關聯起來的數據還有很多很多。
在資料庫中,各種數據之間的關係是通過某個具體的欄位表示的。
再回到我們的案例中,用戶基本信息和用戶訂購記錄必然是有關係的,而通過昨天導入的數據,我們發現這種關係通過用戶ID欄位就可以表示,因為用戶ID是唯一的,這是設計數據結構是刻意設計的。
一個訂購記錄是哪個用戶的,或一個用戶訂購過哪些產品都可以通過這個關係找到。
先拋出問題:
我們要分析Who的問題,即那個地區的用戶購買的更多,但目前訂購信息和用戶所屬地區在兩個數據集中,怎麼辦呢?
我們需要創建用戶數據和訂單數據之間的關係,創建關係要使用用戶ID欄位。
在PowerPivot中,創建數據關係步驟如下:
1、在「訂單」數據表中,選擇用戶ID列的任一單元格。
2、選擇「設計」菜單,並點擊「創建關係」子菜單,如圖:
3、打開創建關係窗口,並按下圖所示選擇查找表和查找列:
4、點擊「創建」按鈕,創建關係。
5、如何判斷是否成功創建關係了呢,有三種方法:
第一種:訂單表用戶ID列頭會出現一個小圖標
第二種:點擊「設計」菜單下的「管理關係」子菜單,可以看到關係
第三種:點擊「開始」菜單下的「關係圖視圖」子菜單,會切換到關係視圖,看倒關係如下:
通過上面的步驟成功創建了數據關係,現在我們回到剛才的問題,要知道那個地區的用戶購買更多。
1、創建新的數據透視表,並按如下布局:
此處的重點在於:
A、欄位來自2個表
B、用戶ID要設置為計數,而不能求和
2、得到數據透視表前10行如下:
通過數據看,上海、北京、廣州排行前三甲,是消費主力地區。
動手試試:
剛才分析了購買人數的地區分布情況,自己動手試試其他情況:
1、消費總金額的地區分布排行情況。
2、男女的消費金額分布。
3、不同年齡的消費金額排行。
今天重點說明了什麼是數據關係,同時演示了在PowerPivot中如何創建關係及如何使用數據關係。
我們的案例使用了2張數據表,但實際中,數據表一定會更多,關係也會更複雜,但不管怎麼樣,關係的本質都相同的,只要理解了數據關係,再多關係也不怕。
怎麼樣?是否搞明白了PowerPivot的多表關聯分析?
本文的數據案例資源,可以關注公眾<大數據分析獅>,回復<PowerPivot關聯分析>免費獲取!
推薦閱讀:
※雨沐田:初識Excel大數據分析工具PowerPivot
※「異類」年度大數據引領消費生態大進化
※《大數據導論》讀書筆記——Chapter 6
※詳解:大數據分析的學習之路
※用數據來一窺GAFATA