POINT問答 | LOD 初體驗

Tableau 有4大技能:表計算、函數應用、參數應用和LOD。這篇文章就帶大家來看看什麼是LOD。

LOD全稱是 Level of Detail,是9.0推出的功能。雖然LOD的出現,大大提高了軟體使用的靈活性,為控制使用可視化中的數據提供了方法。但事實上是,它可能有點棘手,想要做到完全理解並不容易。

一、什麼是Detail

為了理解LOD需要在什麼時候使用(When),哪裡使用(Where),如何使用(How),首先要理解清楚什麼是Detail(中文:細節,下文統一使用英文Detail)

數據的存儲 :

日常所接觸道的數據有,Excel、文本、資料庫。這些原始數據的存儲是怎麼設置的?

拿銷售數據舉例,一個公司的銷售數據,就類似於賬本,是一條一條累加所得,原始數據是一個很大的集合,由精確的每一條目組成。當周期報告銷售情況的時候,進行分類匯總。

聚合 :

當我們閱讀周期報告的時候,並不會關注每一條訂單。或者說,不同部門的人、不同領導層關注的重點也是不同的。

比如:

  • 有人關心各個銷售大區的的銷售對比情況
  • 有人關注各個月的的同比
  • 有人關注用戶的重複購買率

這個所謂的不同的關注點,體現在技術上就是層級,也就是Detail。在層級的體現上有兩個極端,一個是聚合,另一個是Detail

所謂聚合,就是用一個特定的數字,去表示一群數據。

聚合的,就是最概括的,最精簡的,利於閱讀。

Detail的,就是最詳細的,最繁雜的。

那麼就可以理解為,不同的詳細層級間是由一個個單獨的虛擬的層劃分的。我們所的關注的層,就是Level of Detail,它所代表的就是我們關注數據的詳細程度。

二、如何定義層級Detail

在Tableau的可視化視圖中,所有能夠影響當前視圖構成的欄位,這些欄位中所能夠涉及到的最詳細的級別,就是該視圖所代表的Level of Detail

修改視圖Detail層級的方法有三種:

  1. 行和列欄
  2. 詳細工具欄
  3. LOD

方法1 行和列的欄位放置

將維度欄位拖放在「行」或「列」中,會更改軸的標記方式

軸上有州和Sales,目前最詳細的就是州,將Sale在州的層級上聚合。

分析一下,實際訂單的Sales是具體到,是哪個用戶在什麼時間買了什麼產品。而這個視圖兩個欄位 ,因為只有州,沒有用戶信息,也沒有時間。

所以統計的就是,全部數據中各個州的Sales是多少,具有概括性。

來嘗試將Category拖入視圖,變成如下

也就是說,我們在條形圖中獲得更多的粒度和更少的聚合。換句話說,我們更換了Level of Detail。

方法2 Detail Shelf

第二種定義Detail級別,是在詳細信息欄,也可以叫做Detail bar,或者標記欄。

這裡存在的欄位,不論放置在顏色,或者大小,都可以產生Detail定義的作用。至於拖到這裡的欄位會對視圖有什麼影響,要根據具體情況而定。

舉例使用一張散點圖 ,當前構成視圖的是 Sales 和 Profit。

只有一個點,是因為我們沒有對數據進行細分,只有行列上的兩個很粗糙、很概括的維度。換句話說,我們的Detail層級最高,也就是最聚合的。下面拖拽訂單ID到Detail欄中,此時視圖變化了,出現N多點。

現在視圖表示的Detail層級就是訂單ID,每個點代表一個ID訂單。

驗證一下,視圖中左下角可以看到一共5009個標記

驗證一下訂單ID的數據條數,也是5009條

這樣就做到了最頂級的聚合到詳細級別了

方法3 LOD

前邊這兩種方法的共性是,如果拖拽一個其它維度的欄位到行、列或者Detail shelf,那麼整個視圖的形態就會立即變化,根據當前最新的Detail層級變化。

而LOD的特色是,你可以在定義Detail層級的同時,獨立於視圖中使用的維度。一切設置都體現在計算欄位的表達式中。

LOD初體驗就但這裡結束啦,具體的操作方法請期待之後的文章^_^

更多內容請關注POINT .小數點的微信公眾號:POINT 小數點數據


推薦閱讀:

Python爬蟲入門 | 5 爬取小豬短租租房信息
手機報表用處多,這些場景值得收藏!
我想扯一點淡
猴子第三講實踐筆記—對航班計劃數據的處理

TAG:數據分析 | 互聯網 | 職業發展 |