數據可視化一撇——Tableau急速入門

(此文在我的另一個主頁——簡書——也有發布,那裡有更多我的文章sherryup的簡書)

先解釋圖片內容,依然是2015年重點城市全年的空氣質量情況(用同一個數據源的還有這兩篇:2015年全國368個城市空氣質量指數可視化和用Tableau展示的2015北京空氣質量指數匯總圖),不過這次展示的角度不同——用了三個指標:全年平均指數、日均指數和重點城市污染指數。

全年平均指數是一個概覽,用一個地方全年指數總和/天數,粗略計算出平均值。可見污染嚴重的地方主要集中在華中一帶。

其次,加入時間概念的是日均AQI,可見空氣質量的季節性影響因素。

最後關注重度污染天數(即污染指數在300以上的天數),這裡我的數據居然給到沒想到的答案——和田和伊犁地區重度污染天數還挺多——這個有待考察。

Tableau好在界面豐富~

以下是Tableau的急速入門:

一句話來說,可以當做是Microsoft Excel的繪圖專用版。

1、數據源

可來自本地的Excel、Access、文本文檔等,或者鏈接到外邊的資料庫,兼容性超強。不列舉了,看圖:

Tableau支持的數據源

數據源有了,開始導入吧!等等,需要注意的是,導入你的數據源之前最好做個清理,因為Tableau主打的不是數據清理而是成像啊~當然它內部也能對數據做一些簡單刪選、計算,但沒有如Excel之類處理起來那麼順手。所以最好導入的數據源是清理過的,比如首行已經是欄位名,地理信息補全,日期欄位已經轉換成日期格式。

導入數據源之後,點擊你需要做分析的表(比如一個Excel文件簿的Sheet2)。接下來Tableau會自動識別每個欄位的屬性,主要有:字元串、數字、日期&時間和地理角色,有時候它會識別不準,需要你手動去調節——比如地理信息它識別成字元串,之後你想生成地理信息圖就會出錯,你需要了解數據源的屬性、並根據你的分析需求對應到Tableau的屬性(就是下圖中小地球那一行內容)。對應不需要進行展示的欄位,可以隱藏(跟Excel真是如出一轍!)

注意設置欄位屬性啦

2、工作表,儀錶板

數據源設置好屬性後,根據你需要分析的欄位,拖拽出來到「行、列」位置,Tableau會自動新建工作表(可以簡單理解為Excel的 sheet)(這裡跟數據透視表很像),之後你的圖表就是基於這個工作表生成啦!你可以根據不同分析角度拖拽不同欄位出來生成不同的工作表,再基於這些不同的工作表你就能生成不同內容的圖表啦!

Tableau的基本元素——數據源、工作表、儀錶板、故事書

講到這裡,Tableau的基本元素和關係就出來了,數據源是資料庫,工作表是主題資料庫,同時它也能做展示,儀錶板便於你吧不同主題的數據表(或圖)拼接到一塊兒,做整體展示。

3、故事書

這個有點像PPT……我真的沒有在黑Tableau。

也就是你要展示一個宏大的主題(不一定宏大啦,小主題也行),需要有一個講故事的心態,有綜述、分說和總結、預測(故事線)。故事書就是幫你整合你的數據和圖表的。它能插入圖片、簡單排版,利於你展示。

4、沒了。其他細節我覺得跟學Excel的透視表、透視圖、圖表沒有差別,自己摸索。

我看過的資料:Coursera課程:Fundamentals of Visualization with Tableau——加州大學戴維斯分校,英文的,中文的話看優酷一位名為SpiderManFor的up主po的大概五集、每集十來分鐘的視頻,不行還有Tableau的官方教學視頻。

Tableau是要收費的,一千多吧,我沒買,是試用的,一次註冊試用有效期為15天(學習來說夠了)。以後進公司了再申請來用(如果公司有資源的話)。工具而已,真的不需要dive into,除非有人給你錢。

以上,希望對你們有幫助。


推薦閱讀:

用R語言復盤美國總統大選
大家說的智慧出遊,到底指的是什麼?
十行代碼看到空氣質量指數
如何私人定製一幅可以交互的《權力的遊戲》地圖?

TAG:TABLEAU | 数据可视化 |