數據說故事(Tell A Story With Data)

多少人還記得,我們小時候的語文作業就是根據圖片講述你認為在圖中發生的故事, 也就是我們常說的看圖說故事。基本上我們在看那些書本給我們的圖的時候,我們大部分人都很清楚地能想像到圖中發生了什麼樣的故事,然後我們自己把它寫下來。這樣做最主要的好處是:鍛煉我們的敘事能力。 但是大家可以回想一下,當你聽我這個故事之後很久回想起來,你還會記得那個故事。(我到現在還記得小學課本烏鴉喝水的故事,還有插圖)

隨著數據分析的發展,這個概念引進到數據分析中,通過數據分析的可視化來敘述數據背後發生的故事。我們可以看一個簡單的例子:泰坦尼克沉船事件。

如果熟悉這個故事的人都知道,世界聞名的巨輪泰坦尼克號在眾人的期待中駛向了大西洋,不幸在圖中遇到冰山,最後沉沒。但是在沉沒的過程中也有人獲救,這些人都是什麼人呢?為什麼他們會獲救呢?我們可以看一下在mosaic plot顯示的不同等級船倉中,男性女性的獲救比例。(深色的部分表示死亡,淺色的部分表示心存)

那從這個圖標中我們可以知道什麼信息呢?

  1. 在這次事件中,當災難發生的時候,人們傾向於保護婦女和兒童,所以我們可以看到,婦女存活著的比例要遠遠高於男性。
  2. 是不是富有的人在災難發生的時候有優先權呢?根據我們構建的圖標,答案是的。不管是男性還是女性,頭等艙中的存活率要高於次等艙和低等艙
  3. 船員是不是都在關鍵的時刻會保護你呢?這個結論可能有呆商榷,但是我從我們上面構建的圖標可以看到。在四中身份(頭等,次等,低等,船員)中船員的存活了是排在第二位的。(我們可以理解有些船員,帶著有錢人剛快跑了。)

當然還有跟多的理解,如果讀者看過泰坦尼克號的話,在讀這幅圖的時候應該會覺的很有意思。我們可以回顧一下泰坦尼克的電影,不難看到上面圖標表達的信息和電影中的場景吻合。就是在巨輪要沉沒的時候,頭等艙的女性小孩先行離開了,之後就是那些有錢的富人和船員。

拿破崙入侵俄國的戰爭

圖中的棕色是法國大軍進攻的路線,路線的寬度表示法國法軍擁有的士兵的數量,寬度越大表示士兵數量越多。我們可以看到從出發地到Moscou(莫斯科),法軍擁有的士兵的數量在不斷的減少(如果清楚這張戰役的人知道,是因為嚴寒的天氣,很多法國士兵在行軍過程中都凍死了)。黑線表示的是法軍撤退的路線,同樣的寬度表示的是士兵的數量,法軍在撤退過程中,士兵總量依然在減少,一直到大軍撤回法國,回來的士兵不足出發的士兵的10%。而絕大多數都是死在寒冬的天氣中。圖表中,在撤離的黑線上,有不少節點連接到最下部的溫度線上,這些表示的是在行軍路線上當時法軍到達這個地方的溫度

推薦閱讀:

對B站彈幕數據分析及可視化的小例子
SQL初級數據分析(基於Microsoft Access)
python抓取課工廠網站數據和分析|python數據分析實例
人類史上最大惡性海難-TITANIC沉船事故
Python語言基礎

TAG:數據可視化 | 數據分析 |