Tableau冠軍獨家秘籍,看可視化語法如何巧妙引導思維
文/林雨暘
隨著數據使用量的增長,越來越多的人通過數據來尋求專業問題的答案。數據可視化是一個溝通複雜信息的強大武器,通過可視化信息,我們的大腦能夠更好地抓取和保存有效信息,增加信息的印象。如何利用好可視化工具?如何煉成可視化大師?在1月17日的數據俠線上實驗室,DT君邀請到2017Tableau大賽上海冠軍、Merkle數據分析師林雨暘,為大家傳授「秘籍」。
數據可視化:一場帶有目的性的溝通
今天我演講的主題是從Tableau可視化大賽學數據話術,換句話說就是怎樣利用數據可視化的方式,在工作或是生活中達到想要的目的。
在正式進入主題之前,我想先分享兩位我非常喜歡的可視化大師。
第一位是美國的前副總統阿爾·戈爾,他在2006年時上過TED的演講,主題是對氣候危機的新思考。令我印象深刻的是,他站在整個屏幕的最右邊,利用PPT清楚地向大家展示地球CO2濃度達到了怎樣的高度,進而提醒人們CO2對地球升溫整體造成的影響。
另一位是蘋果的靈魂人物史蒂夫·喬布斯,每一次蘋果的產品發表,他都會用淺顯易懂的可視化方式去呈現蘋果運營數字。
阿爾·戈爾和史蒂夫·喬布斯在和聽眾溝通時,都利用了數據可視化的方式達到他們的目的,成果是有目共睹的。我一直認為,數據可視化就是這樣帶有目的性的溝通過程,因此如何有效地利用可視化進行溝通,並且達到目的,在大數據時代非常重要。
接下來,我將以我參加Tableau比賽的經歷,來詳細講一講如何滿足雙方溝通的期待,贏得比賽。
我身為一個參賽者,在比賽過程中必須滿足評委對數據可視化、比賽規則的期待。
這個期待我把它分為兩個部分,一部分是合情,另一部分是合理,合情是指一些比較硬性的規則,如需要用什麼樣的工具操作、用哪些數據來做可視化報告;合理是指如何用可視化語法去解讀數據。
如何用:基本工具和數據分類
首先我們要先了解實現數據可視化的工具——Tableau。Tableau有三個大的產品線,分別是Desktop、Server (包含Server與Online)和Tableau Public。
也許很多人認為Tableau是很難入門,其實它可以直觀地理解成是Excel加上PowerPoint的合體,最後可以呈現出來的效果就像下圖,無論是折線圖、長條圖甚至是地圖的功能,它都能夠實現。
除了工具以外,我們還需要知道哪些數據可以分析,數據本身如何分類。
我們可以把數據進行高維度地分類:
第一類是分類變數或是名義變數(Think Named…),這類變數像是地區性、姓名等訊息,它們本身不會有先後次序,也不會呈現這背後具體代表了多少的數字。
第二類是順序變數(Think Ordered…),這類變數的呈現方式是有先後次序的,可能是從1排到100、或是從時間近的排到時間遠的。
第三類是區間變數(Think How much/many?),例如重量、成本、折扣,都算是區間變數。
如何說:數據可視化的語法
針對不同種類的數據,有這樣一個粗淺的認識後,我們就可以進到下一步——數據可視化的語法,如何「說」才會讓聽眾在視覺效果上更舒服,且能夠容易地記住你的內容。
我在這裡給大家分享3種數據可視化的語法,分別是心理學、實測和通用規則。
首先是完形心理學,也叫做格式塔理論,理論內容是人們總是會先看到整體,再去關注局部,人們對事物的整體感受不等於局部感受的加法,視覺系統總是在不斷地試圖在感官上將圖形閉合。
我們可以來看下面這些如鄰近、相似、閉鎖、對稱等關係,這些關係實際上能怎麼利用到設計可視化報表中呢?
下面這張動圖可以更明顯地解釋完形心理學:
大家看到這張動圖,這些點從一開始散布在畫布上,到特有位置或者特有顏色,甚至是利用外加框的方式實現分群辨別,這些都是在做數據可視化時常常會用到的技巧。
其次就是實測——人眼追蹤技術,以此能清楚了解人的視覺路徑。
大家可以看到下圖所顯示出來的,通過追蹤眼球落點的先後順序,或者通過熱力圖的方式,知道人的眼睛到底停留在畫面的哪個部分是較久的,進而去推出一些通用原則用於設計可視化的報表。
其中,眼球追蹤技術有兩個結論我認為是非常關鍵的,一是F式布局。
大家可以發現上圖熱力圖的分布布局都像一個「F」,即人的眼球會先從左上角掃描到左下角,接著再從左到右。
二是空白很重要。
大家可以發現上圖左邊和右邊的熱力圖顯示出的密集程度是不一樣的,左邊密集程度比右邊密集程度低,導致這其中的差別就是右邊背後的文本,當文字與文字間、圖片與圖片中間的空白是足夠多的,人的眼睛看起來會更舒服,並且願意停留更久。
最後是在商用條件下的通用規則,這能有效地掌握雙方的期待。
上圖是由一位美國博士提出來的簡單工具,它能夠在你看到數據維度時,從原則性的角度出發告訴你在碰到不同情境之下應該用什麼樣的圖表來做呈現。
另一個通用原則是關於儀錶板的三種經典類型,分別是戰略型、運營型以及分析型。
戰略型儀錶盤更多的是為高層管理者快速掌握企業的運營情況,並據此快速做出決策和判斷,對過去做出總結或是對未來擬定戰略性目標。
戰略型儀錶板的使用情境,就像是你要和公司高管去做簡報,必須要在很短時間內把報告里的重點都消化完,所以這樣的報告理論上都會是靜態的,並且會凸顯報告中的一些關鍵數字,讓你的高管一目了然。
運營型儀錶板相較於戰略性而言,不同的特點在於它的本質是動態且直接的。
當我們給管理者一堆報表,再優秀的管理者,他也不能夠及時地反應過來,該如何駕馭好企業的運營之舵。而運營型儀錶板背後的數據其實是「活」的,你需要定期去更新儀錶板背後的數據內容,從而能夠讓決策者能夠在較短的時間內消化,看出數據中有問題的地方進行追蹤。
分析型儀錶板的作用主要是讓使用者可以獲取到各個前端業務信息系統的數據,需要額外的上下文,不能光有一張分析的儀錶板,而是需要連續2-3張,能夠讓你的使用者針對設計出來的儀錶板去做更深入的追蹤,從而看出數據當中的一些問題。
這裡分享一張關於我自己根據這些通用的原則,在比賽現場做出來的作品當中的一張幻燈片。
這張圖表現了中國在過去的十幾年中所有的創投是怎樣分產業的,依據不同產業的情況能夠看出金額的分布。Tableau非常強大的地方就在於你可以實時地去做一些操作,也就是像這張動圖裡面所顯示出來的,可以根據下面的小游標,去告訴觀眾現在眼睛應該要看到什麼地方。
用創意圖表驚艷你的聽眾
講完了這些簡單的原則後,我認為如果最後想要拿下比賽的冠軍,或是要在談判中取得勝利,你必須要從錦囊當中拿出一些讓人驚喜的內容。
大家都知道,我們常見的圖表有條形圖、折線圖、地圖等,而通過一些非典型的圖表可以實現給聽眾驚喜的目的。
例如下面展示的四幅圖:漏斗圖、南丁格爾玫瑰圖、路徑走向圖、甜甜圈圖,靈活應用這些圖表能夠讓整體的數據可視化報告增添讓人意想不到的驚喜。
除了上面提到的幾種圖表以外,這裡再詳細介紹兩個我在報告當中非常喜歡用到的圖表。
一是Bump Charts(凹凸圖):
凹凸圖最主要能夠呈現出次序的時間類比、次序的數據類型。並且加上時間維度之後,就可以很清楚地看到無論是公司的產品、銷售來源或是任何可以排名的東西,在經過時間軸的眼鏡之下,可以怎樣去做趨勢的分布。
二是Sankey(桑基圖):
桑基圖可以在不同時間節點上看到數據到底是怎麼流通的。
比如說客戶群體從A到B到底是怎樣去變化,可能在節點A時,客戶群體有十個人,到節點B時,客戶群體變為20個人,那通過桑基圖,我們就可以更直觀地觀察這些人群的分布動態到底是怎樣的。
除了這些Tableau裡面自帶,但你可能要經過一些特別設計甚至寫一些數學函數能夠呈現出來的圖形以外, Tableau也有非常大的彈性,能夠讓你除了它本身的功能以外,可以結合如JavaScript的一些解決方案。
如利用Tableau和D3(D3即Data-Driven Documents,是一個基於JavaScript在網頁上實現數據可視化的工具)更有彈性地去設計出Tableau里沒有辦法設計出來或是需要較長時間開發出來的圖形。
(圖片說明:通過Tableau製作的可視化圖表,展現權力遊戲中每個王國間的互動關係)
回到今天分享的主題——如何通過數據可視化的方式達到談判的目的。
總結來說,我們可以從最基礎的原則開始,例如心理學原則、眼球追蹤原則、特殊的可視化效果、結合不同的技術和創新,從而讓你的觀眾留下更深刻的印象並達到溝通的目標。
除此之外,我認為還有最重要的一點——練習。我給大家推薦幾個關於數據可視化的學習網站,上面有很多數據可視化大師的作品或豐富的數據源可以拿來練手。
註:以上內容根據林雨暘在數據俠線上實驗室的演講實錄整理,已經本人審閱。本文僅為作者觀點,不代表DT財經立場。
編輯 | 項靜
題圖 | 視覺中國
▍數據俠門派
本文數據俠林雨暘,現任上海電通Merkle數據分析師,協助娛樂、高科技等客戶透過數據挖掘的方式發現並創造價值。熱愛數據和統計、營銷、科技,曾自主創業,擔任過跨國銷售、上市專案經理等職位。旅居歐洲、美國等地,喜歡旅行、閱讀、運動、音樂、Podcast。現與朋友經營RS實驗室訂閱號,希望利用數據分析的方式發現生活中有趣的事物。
▍加入數據俠
「數據俠計劃」是由第一財經旗下DT財經發起的數據社群,包含數據俠專欄、數據俠實驗室系列活動和數據俠聯盟,旨在聚集大數據領域精英,共同挖掘數據價值。了解數據俠計劃詳情請回復「數據俠計劃」,投稿、合作請聯繫datahero@dtcj.com。
推薦閱讀:
※Matplotlib中將兩條不同曲線共軸
※Matplotlib中關於坐標軸的控制
※運動軌跡熱力圖中的台灣導彈基地安全隱患