Tableau 基礎 | 「集」能做什麼?
在一些高級分析中常常見到集的蹤影,無論是與參數的配合,或者是與篩選器的配合,可以完成意想不到的效果。而且集還可以與計算欄位配合。所以它絕對是主演之一!
參考文章:An Introduction to Sets ; When to Use Filters, Groups & Sets in Tableau
老規矩,先提問:
Set 和 Group ,有什麼區別?
什麼時候用Set?什麼時候用Group?
關於 Set ,先來看看Tableau官方的定義:
集(Set),是根據某些條件定義數據子集的自定義欄位
來看個栗子,如下是用戶與銷售額的Bar Chart,手工選取前10名創建集合(橙色部分)
將這前十名的集合套用在利潤里的散點圖中,可以看到這10個用戶的分布情況:那麼Group的典型應用也來一枚:
當一部分產品類別具有較少的佔比,不具明顯的統計意義我們可以使用分組(Group)將這類產品劃分為一類Other
Set 與 Group 的區別
同樣是將同一維度下的多個項目劃分到一起,那麼他們有什麼區別?
各自的定義如下:集,Set:
集合是一個數據的子集,在原始數據中,根據某種條件而劃分出的數據子集
組,Group:
通過將大量維度成員組合到更高級別的類別中,來簡化大量維度成員
區別一: 執行計算
你可以對集合執行計算,但是組不能執行計算
(這裡可能需要一個栗子)
區別二:細分層級
Set 的效果,相當於是二進位,對維度的分割,只有兩種結果,in or out,也就是符合條件的是in,不符合的是out
Group 是根據實際需要而劃分的項目聚合
區別三:編輯面板
Set:不僅僅可以通過手工選擇去設置成員,還可以通過「條件」和「排序」
Group:只能通過選擇組成員
如何創建一個集(Set)
常規方法,有2:視圖中選取項目進行操作
維度欄位右鍵創建
第一種方法也是最直接的方法,通過按住Ctrl多選需要分割的項目成員,選中後會自動彈出下圖中的快捷框,點擊箭頭標示的創建集合
彈出創建Set對話框,設置Set的名稱
在單擊OK後,在窗口左側的Sets窗欄可以看到該Set:
第二種方法,在需要分割的維度欄位上右鍵,找到創建,再點擊Set
彈出對話框,根據需要選取成員,點擊OK即可請注意,這兩種常規方法創建的集合是靜態的,因此數據更新,比如篩選器變化,那麼新客戶是無法自動更新的。注意看對話框的另外兩個選項卡Condition
Top
這兩個選項卡可用於條件設置和前N項的動態操作
Set的5種應用場景
1 作為篩選器
實驗視圖
Set可以用作篩選器,先做個Set
設置,按照欄位篩選,利潤小於0
在新創建的Set上,右鍵顯示篩選器Set是所謂的二進位模式,對於被篩選的數據,要麼在集合內,要麼在集合外
如果選擇「內」,則只顯示滿足篩選條件的項目,也就是利潤為負值的子類別。2 作為標記
Set本身的技能就是通過特定的規矩,將項目成員分類。
從數據分層的理解上,相當於增加了一個Level of Detail:
所以如果set應用在Mark標記欄的時候,即可以在視圖上區分in 和 out的項目
Set是全局項目,也可以應用到相關的其他圖表中購買數量與利潤率的分布情況
3 作為計算欄位
集可以在計算欄位中使你就把它當做是維度或度量。
這樣,根據Set的先天優勢,就可以根據它們是否在集合中,來針對性處理維度成員。
下面是一個簡單的例子,還是基於負利潤的故事,我們來編寫一個計算欄位:
註:[負利潤]指的是前一節創建的Set
IF [負利潤] THEN 賠錢 // 如果Set成立,則標記賠錢nELSE OthernENDn
此時計算欄位已經生成,可以發揮它的作用了,比如維度的劃分:
餅圖對比:提一句,通過Group或其他方式實現同樣的結果,就稍微麻煩些:分類圖
需要先編寫一個計算欄位,用以區分利潤的情況
之後拖入視圖即可構造類似Set的報表
餅圖餅圖稍微麻煩一點點。首先需要將子類別製作分組需要先確認哪些子類別是負利潤的組,而且不能套用公式,只能手動分組
兩組
盈利
負利潤
選中新的欄位子類別(組)以及記錄數,使用智能顯示生成餅圖
最大劣勢:Group中不能使用條件判斷,這點比set落後太多
4 作為維度欄位
既然Set可以當做欄位使用,Set本身是分類,當然可以當做維度使用。
拖拽到列視圖,就分為不同的列,優勢是:
不用手工編寫計算欄位
5 自定義層次結構
正如前文所說,Set的作用相當於增加了一個Level of Detail層級,這個架構允許我們做下鑽操作。
以此為基礎,我們可以將Set創建為分層結構
為了方便區分,我們將之前用Set建立的計算欄位名字改為「是否盈利」
在左邊的維度窗格,多選需要創建分層結構的欄位,右鍵定位到分層結構-->創建分層結構
彈出對話框為該結構命名
確定之後,左側維度窗格就會出現如下的列表
在兩個欄位之上有「盈利分層」的字樣
左側有分層結構的專用圖標
此時,將「盈利分層」這個新欄位,拖入視圖中,可以看到
左邊帶有「+」號
視圖默認為摺疊,即頂層的是否盈利
點開加號後,即為下鑽數據
集的典型應用
Top 5
動態查看指標
之前的文字一直在強調Set的特點,就是通過condition設置集合數據範圍,特色就是動態更新顯示結果
2012-2014年的子類別中,末尾銷售情況,可以看到:
倒數1、2、3排名沒變
但是倒數第4名,2012年、2014年是用品,2013年時紙張
根據這樣的數據,我們如果只看單獨一個年份數據,比如只看Bottom 4,那麼,我們的篩選器就需要動態更新。
來建立一個set
將set拖拽帶篩選器中,並且設置顯示快速篩選器此時通過切換不同年份,即可查看Bottom 4 位的子類別,而且是動態更新的:使用Top(頂部)這個選項卡
按欄位:底部,4欄位為:銷售額
2012的數據,用品最好
2013的數據,紙張最好
2014的數據,用品最好,和2012年一樣
註:下周更新,常量集、計算集、合併集1 此處的動態數據篩選,涉及到上下文篩選器(Context Filter)會在之後的推送中咱們去聊
2 根據後期的案例會持續在此處更新Set的案例
更新記錄:
2016-12-15 發布
2016-12-16 補全5種應用場景,增加與Filter的對比
2016-12-19 增加常量集、計算集、合併集的栗子
<未完待續>
Peace!
推薦閱讀:
TAG:TABLEAU |