數據說故事(Tell A Story With Data)
隨著數據分析的發展,這個概念引進到數據分析中,通過數據分析的可視化來敘述數據背後發生的故事。我們可以看一個簡單的例子:泰坦尼克沉船事件。
如果熟悉這個故事的人都知道,世界聞名的巨輪泰坦尼克號在眾人的期待中駛向了大西洋,不幸在圖中遇到冰山,最後沉沒。但是在沉沒的過程中也有人獲救,這些人都是什麼人呢?為什麼他們會獲救呢?我們可以看一下在mosaic plot顯示的不同等級船倉中,男性女性的獲救比例。(深色的部分表示死亡,淺色的部分表示心存)
那從這個圖標中我們可以知道什麼信息呢?
- 在這次事件中,當災難發生的時候,人們傾向於保護婦女和兒童,所以我們可以看到,婦女存活著的比例要遠遠高於男性。
- 是不是富有的人在災難發生的時候有優先權呢?根據我們構建的圖標,答案是的。不管是男性還是女性,頭等艙中的存活率要高於次等艙和低等艙
- 船員是不是都在關鍵的時刻會保護你呢?這個結論可能有呆商榷,但是我從我們上面構建的圖標可以看到。在四中身份(頭等,次等,低等,船員)中船員的存活了是排在第二位的。(我們可以理解有些船員,帶著有錢人剛快跑了。)
當然還有跟多的理解,如果讀者看過泰坦尼克號的話,在讀這幅圖的時候應該會覺的很有意思。我們可以回顧一下泰坦尼克的電影,不難看到上面圖標表達的信息和電影中的場景吻合。就是在巨輪要沉沒的時候,頭等艙的女性小孩先行離開了,之後就是那些有錢的富人和船員。
拿破崙入侵俄國的戰爭
圖中的棕色是法國大軍進攻的路線,路線的寬度表示法國法軍擁有的士兵的數量,寬度越大表示士兵數量越多。我們可以看到從出發地到Moscou(莫斯科),法軍擁有的士兵的數量在不斷的減少(如果清楚這張戰役的人知道,是因為嚴寒的天氣,很多法國士兵在行軍過程中都凍死了)。黑線表示的是法軍撤退的路線,同樣的寬度表示的是士兵的數量,法軍在撤退過程中,士兵總量依然在減少,一直到大軍撤回法國,回來的士兵不足出發的士兵的10%。而絕大多數都是死在寒冬的天氣中。圖表中,在撤離的黑線上,有不少節點連接到最下部的溫度線上,這些表示的是在行軍路線上當時法軍到達這個地方的溫度
推薦閱讀:
※對B站彈幕數據分析及可視化的小例子
※SQL初級數據分析(基於Microsoft Access)
※python抓取課工廠網站數據和分析|python數據分析實例
※人類史上最大惡性海難-TITANIC沉船事故
※Python語言基礎