Tableau數據 | 數據排列方式那麼重要麼?
故事起源
一個小夥伴要製作「堆積圖」,抓破頭皮也沒做出來
- 介紹圖表--圖表分類
- excel軟體中的實現過程
- tableau的製作圖表的基本原理
- 數據分層結構
- tableau軟體中的實現原理
- 栗子
- 兩種結構有什麼區別
- 解決數據問題的方法
好了,開始
介紹圖表--圖表分類
在說「堆積圖」之前,需要先知道「柱形圖」。百科:
柱形圖 :英文,histogram,column diagram 或者 column chart
另外,還有一種常見的圖是「條形圖」,「條形圖」英文是 bar chart(貌似只有Office的軟體是這麼分類)
但「柱形圖」與「條形圖」二者實際都統稱為bar chart,只不過一個是vertical,一個是horizontal。在Office軟體中為了幫助區分而命名的(tableau中不做此區分)
有沒有頭暈?柱形圖還可以再細分子類:(等改天有空再貼出示例圖)簇狀柱形圖
堆積柱形圖圓柱圖、圓錐圖和稜錐圖
繞了一大圈,終於到今天的主題了,兩句結論:
堆積圖是柱形圖的一種
柱形圖和條形圖,都是bar chart
如下是,最常見的基本柱形圖 ↓
這個也很常見,同比、環比的圖表 ↓
也有這種變化的堆積圖,只不過是曲線圖而已
再來些好看的,這些設計感十足的信息圖也是衍生的Bar chart:
Excel軟體中的實現過程
假設數據如下
注意,數據是我隨便編的,如有雷同純屬巧合班級
學號(ID)名字語文、數學、英語
如果需要查看以每個學生為單位的總成績堆積圖,操作很簡單:
- 首先,選中數據
- 點擊INSERT菜單中的插入圖表
- 找到Stacked Column。完成!
tableau的製作圖表的基本原理
說原理之前,要說說數據分層結構
我們來創造一個特別簡單的數據吧,比上邊考試成績的數據還要簡單:
1班有4個小朋友
ID就是學號,從S001到S004三個男孩,一個女孩
我們所說數據層次你可以這麼理解,來,嘗試把表格橫置試試看
越往上,越概括----細節很少
越往下,越詳細----詳細到具體的每一條數據記錄
所以在tableau中,如下圖的mark標記框,就是軟體識別詳細級別的位置(在全部視圖範圍內識別詳細級別)
如果開啟了數據自動聚合,軟體總是按照當前的最詳細的級別去呈現數據
上邊的話有點繞,說人話就是:
所以,我們來繼續看男孩女孩這個數據,如果我要看全班的,那就:視圖中,你需要聚焦到哪個層次,就需要把哪個層次的數據拖入到mark或視圖中
拖入班級的級別到mark欄
如果要看到性別的,就拖入「金字塔」性別那個層的欄位,放到mark欄:
拖入性別到mark中
可以看到男女分開了
但是顏色還是統一的,那是因為
用來區分性別的欄位,並沒有告訴tableau如何區分
默認只是從邏輯上區分,視覺上需要再操作:
將「性別」欄位拖入到顏色框中
所以,這就是tableau軟體中的實現原理
詳細級別
栗子
回到考試成績的數據
姓名
年齡身高體重......
我們注意觀察三個學科,你發現語文、數學、英語分別為三層、其實是不合理的
換句話說
同類的數據應該歸為一個層次、一個屬性
語文、數學、英語邏輯上同屬於一個類別----學科
而它攜帶的value值,也就成績,屬於另一類----成績
根據這個指示,如果是如下這樣的分層,就合適了:
將學科類別提升
所以,針對原始數據做過修改後應該是:
兩種結構有什麼區別
我們從兩個角度來觀察
先來看看欄位的區別
- tableau詳細級別的原理
- 選中相關欄位後,「智能顯示」可用圖表的區別
將「語文」、「數學」、「英語」欄位合併為「學科」
添加「成績」欄位
先說新數據,從金字塔頂端說起,也就是聚合、概括的這一層次。
現在我的需求是----了解總成績
需要欄位
成績
成績欄位拖入列,新數據Viz的構成,如下:
灰色表示當前激活的欄位不能構成此圖
亮色表示當前激活欄位可以構成此圖
還是同樣的欄位----「總計(成績)」
將滑鼠懸停在對應的圖表上底部的文字就會自動更新
從左到右依次是:水平條、直方圖視圖、餅圖、散點圖
紅色方框標記對應圖表的位置,可以看到
水平條、直方圖,是亮色----可以構成
餅圖、散點圖是灰色----不可以構成
老數據的Viz構成
解決數據問題的方法
方法有2:
先介紹,藉助插件修改原始數據格式
- 藉助插件修改原始數據格式
- 使用tableau自帶的Data Interpreter (Tableau基礎 | 如何應對Excel的格式,這裡提到過)
Tableau在早起版本的時候,官方開發了一個宏插件安裝在excel中,即可快速轉換數據格式,還是蠻好用的,點擊這裡進入原網址。
解壓後,執行安裝文件:
提醒你的是:
進入Excel程序,打開插件管理窗口
勾選「Tableau 7」的插件欄
需要轉換格式的數據(非表頭)的第一行、第一列
此處需要轉換的是「語文」、「數學」、「英語」三列,數據為第二行開始的分數
另外一種是,使用Data Interpreter,還是這個數據,直接拖入tableau
下邊看到「語文」、「數學」、「英語」幾列
按住Ctrl選中三列,右鍵,數據透視表:
執行完畢後,會生成兩個新的欄位,默認名字是:
右鍵可以重新命名:
修改完的結果如下:
也可以在主界面的維度/度量窗格內重新命名:
最終數據是這樣的:
按照如下欄位設置,即可做出堆積圖了:
更新記錄:
2016-12-7 發布
2016-12-8 增加兩種數據結構對比 / 修改錯別字 / 解決方法詳細介紹 / 貼出圖表示例圖
<未完待續>
Peace!
推薦閱讀:
TAG:TABLEAU |