POINT問答 | LOD 初體驗
Tableau 有4大技能:表計算、函數應用、參數應用和LOD。這篇文章就帶大家來看看什麼是LOD。
LOD全稱是 Level of Detail,是9.0推出的功能。雖然LOD的出現,大大提高了軟體使用的靈活性,為控制使用可視化中的數據提供了方法。但事實上是,它可能有點棘手,想要做到完全理解並不容易。
一、什麼是Detail
為了理解LOD需要在什麼時候使用(When),哪裡使用(Where),如何使用(How),首先要理解清楚什麼是Detail(中文:細節,下文統一使用英文Detail)
數據的存儲 :
日常所接觸道的數據有,Excel、文本、資料庫。這些原始數據的存儲是怎麼設置的?
拿銷售數據舉例,一個公司的銷售數據,就類似於賬本,是一條一條累加所得,原始數據是一個很大的集合,由精確的每一條目組成。當周期報告銷售情況的時候,進行分類匯總。
聚合 :
當我們閱讀周期報告的時候,並不會關注每一條訂單。或者說,不同部門的人、不同領導層關注的重點也是不同的。
比如:
- 有人關心各個銷售大區的的銷售對比情況
- 有人關注各個月的的同比
- 有人關注用戶的重複購買率
這個所謂的不同的關注點,體現在技術上就是層級,也就是Detail。在層級的體現上有兩個極端,一個是聚合,另一個是Detail。
所謂聚合,就是用一個特定的數字,去表示一群數據。
最聚合的,就是最概括的,最精簡的,利於閱讀。
最Detail的,就是最詳細的,最繁雜的。
那麼就可以理解為,不同的詳細層級間是由一個個單獨的虛擬的層劃分的。我們所的關注的層,就是Level of Detail,它所代表的就是我們關注數據的詳細程度。
二、如何定義層級Detail
在Tableau的可視化視圖中,所有能夠影響當前視圖構成的欄位,這些欄位中所能夠涉及到的最詳細的級別,就是該視圖所代表的Level of Detail
修改視圖Detail層級的方法有三種:
- 行和列欄
- 詳細工具欄
- LOD
方法1 行和列的欄位放置
將維度欄位拖放在「行」或「列」中,會更改軸的標記方式
軸上有州和Sales,目前最詳細的就是州,將Sale在州的層級上聚合。
分析一下,實際訂單的Sales是具體到,是哪個用戶在什麼時間買了什麼產品。而這個視圖兩個欄位 ,因為只有州,沒有用戶信息,也沒有時間。
所以統計的就是,全部數據中各個州的Sales是多少,具有概括性。
來嘗試將Category拖入視圖,變成如下
也就是說,我們在條形圖中獲得更多的粒度和更少的聚合。換句話說,我們更換了Level of Detail。
方法2 Detail Shelf
第二種定義Detail級別,是在詳細信息欄,也可以叫做Detail bar,或者標記欄。
這裡存在的欄位,不論放置在顏色,或者大小,都可以產生Detail定義的作用。至於拖到這裡的欄位會對視圖有什麼影響,要根據具體情況而定。
舉例使用一張散點圖 ,當前構成視圖的是 Sales 和 Profit。
只有一個點,是因為我們沒有對數據進行細分,只有行列上的兩個很粗糙、很概括的維度。換句話說,我們的Detail層級最高,也就是最聚合的。下面拖拽訂單ID到Detail欄中,此時視圖變化了,出現N多點。
現在視圖表示的Detail層級就是訂單ID,每個點代表一個ID訂單。
驗證一下,視圖中左下角可以看到一共5009個標記
驗證一下訂單ID的數據條數,也是5009條
這樣就做到了最頂級的聚合到詳細級別了
方法3 LOD
前邊這兩種方法的共性是,如果拖拽一個其它維度的欄位到行、列或者Detail shelf,那麼整個視圖的形態就會立即變化,根據當前最新的Detail層級變化。
而LOD的特色是,你可以在定義Detail層級的同時,獨立於視圖中使用的維度。一切設置都體現在計算欄位的表達式中。
LOD初體驗就但這裡結束啦,具體的操作方法請期待之後的文章^_^
更多內容請關注POINT .小數點的微信公眾號:POINT 小數點數據
推薦閱讀:
※Python爬蟲入門 | 5 爬取小豬短租租房信息
※手機報表用處多,這些場景值得收藏!
※我想扯一點淡
※猴子第三講實踐筆記—對航班計劃數據的處理