標籤:

Tableau 基礎 | 「集」能做什麼?

在一些高級分析中常常見到的蹤影,無論是與參數的配合,或者是與篩選器的配合,可以完成意想不到的效果。而且集還可以與計算欄位配合。所以它絕對是主演之一!

參考文章:An Introduction to Sets ; When to Use Filters, Groups & Sets in Tableau

老規矩,先提問:

Set 和 Group ,有什麼區別?

什麼時候用Set?什麼時候用Group?

關於 Set ,先來看看Tableau官方的定義:

集(Set),是根據某些條件定義數據子集的自定義欄位

來看個栗子,如下是用戶銷售額的Bar Chart,手工選取前10名創建集合(橙色部分)

將這前十名的集合套用在利潤里的散點圖中,可以看到這10個用戶的分布情況:

那麼Group的典型應用也來一枚:

當一部分產品類別具有較少的佔比,不具明顯的統計意義

我們可以使用分組(Group)將這類產品劃分為一類Other

Set 與 Group 的區別

同樣是將同一維度下的多個項目劃分到一起,那麼他們有什麼區別?

各自的定義如下:

集,Set:

集合是一個數據的子集,在原始數據中,根據某種條件而劃分出的數據子集

組,Group:

通過將大量維度成員組合到更高級別的類別中,來簡化大量維度成員

區別一: 執行計算

你可以對集合執行計算,但是組不能執行計算

(這裡可能需要一個栗子)

區別二:細分層級

Set 的效果,相當於是二進位,對維度的分割,只有兩種結果,in or out,也就是符合條件的是in,不符合的是out

Group 是根據實際需要而劃分的項目聚合

區別三:編輯面板

Set:不僅僅可以通過手工選擇去設置成員,還可以通過「條件」和「排序」

Group:只能通過選擇組成員

如何創建一個集(Set)

常規方法,有2:

視圖中選取項目進行操作

維度欄位右鍵創建

第一種方法也是最直接的方法,通過按住Ctrl多選需要分割的項目成員,選中後會自動彈出下圖中的快捷框,點擊箭頭標示的創建集合

彈出創建Set對話框,設置Set的名稱

在單擊OK後,在窗口左側的Sets窗欄可以看到該Set:

第二種方法,在需要分割的維度欄位上右鍵,找到創建,再點擊Set

彈出對話框,根據需要選取成員,點擊OK即可

請注意,這兩種常規方法創建的集合是靜態的,因此數據更新,比如篩選器變化,那麼新客戶是無法自動更新的。

注意看對話框的另外兩個選項卡

Condition

Top

這兩個選項卡可用於條件設置前N項的動態操作

Set的5種應用場景

1 作為篩選器

實驗視圖

Set可以用作篩選器,先做個Set

設置,按照欄位篩選,利潤小於0

在新創建的Set上,右鍵顯示篩選器

Set是所謂的二進位模式,對於被篩選的數據,要麼在集合內,要麼在集合外

如果選擇「內」,則只顯示滿足篩選條件的項目,也就是利潤為負值的子類別。

2 作為標記

Set本身的技能就是通過特定的規矩,將項目成員分類。

從數據分層的理解上,相當於增加了一個Level of Detail:

所以如果set應用在Mark標記欄的時候,即可以在視圖上區分in 和 out的項目

Set是全局項目,也可以應用到相關的其他圖表中

購買數量與利潤率的分布情況

3 作為計算欄位

可以在計算欄位中使你就把它當做是維度度量

這樣,根據Set的先天優勢,就可以根據它們是否在集合中,來針對性處理維度成員。

下面是一個簡單的例子,還是基於負利潤的故事,我們來編寫一個計算欄位:

註:[負利潤]指的是前一節創建的Set

IF [負利潤] THEN 賠錢 // 如果Set成立,則標記賠錢nELSE OthernENDn

此時計算欄位已經生成,可以發揮它的作用了,比如維度的劃分:

餅圖對比:

提一句,通過Group或其他方式實現同樣的結果,就稍微麻煩些:

分類圖

需要先編寫一個計算欄位,用以區分利潤的情況

之後拖入視圖即可構造類似Set的報表

餅圖

餅圖稍微麻煩一點點。首先需要將子類別製作分組

需要先確認哪些子類別是負利潤的組,而且不能套用公式,只能手動分組

兩組

盈利

負利潤

選中新的欄位子類別(組)以及記錄數,使用智能顯示生成餅圖

最大劣勢:

Group中不能使用條件判斷,這點比set落後太多

4 作為維度欄位

既然Set可以當做欄位使用,Set本身是分類,當然可以當做維度使用。

拖拽到列視圖,就分為不同的列,優勢是:

不用手工編寫計算欄位

5 自定義層次結構

正如前文所說,Set的作用相當於增加了一個Level of Detail層級,這個架構允許我們做下鑽操作。

以此為基礎,我們可以將Set創建為分層結構

為了方便區分,我們將之前用Set建立的計算欄位名字改為「是否盈利」

在左邊的維度窗格,多選需要創建分層結構的欄位,右鍵定位到分層結構-->創建分層結構

彈出對話框為該結構命名

確定之後,左側維度窗格就會出現如下的列表

在兩個欄位之上有「盈利分層」的字樣

左側有分層結構的專用圖標

此時,將「盈利分層」這個新欄位,拖入視圖中,可以看到

左邊帶有「+」號

視圖默認為摺疊,即頂層的是否盈利

點開加號後,即為下鑽數據

集的典型應用

Top 5

動態查看指標

之前的文字一直在強調Set的特點,就是通過condition設置集合數據範圍,特色就是動態更新顯示結果

2012-2014年的子類別中,末尾銷售情況,可以看到:

倒數1、2、3排名沒變

但是倒數第4名,2012年、2014年是用品,2013年時紙張

根據這樣的數據,我們如果只看單獨一個年份數據,比如只看Bottom 4,那麼,我們的篩選器就需要動態更新。

來建立一個set

使用Top(頂部)這個選項卡

按欄位:底部,4

欄位為:銷售額

將set拖拽帶篩選器中,並且設置顯示快速篩選器

此時通過切換不同年份,即可查看Bottom 4 位的子類別,而且是動態更新的:

2012的數據,用品最好

2013的數據,紙張最好

2014的數據,用品最好,和2012年一樣

註:

1 此處的動態數據篩選,涉及到上下文篩選器(Context Filter)會在之後的推送中咱們去聊

2 根據後期的案例會持續在此處更新Set的案例

下周更新,常量集計算集合併集

更新記錄:

2016-12-15 發布

2016-12-16 補全5種應用場景,增加與Filter的對比

2016-12-19 增加常量集、計算集、合併集的栗子

<未完待續>

Peace!


推薦閱讀:

TAG:TABLEAU |