全球恐怖襲擊數據的可視分析

數據來源: start.umd.edu/gtd/conta

Figure 1 展示了1970-2015年期間全球恐怖襲擊的總體發展趨勢。從數據上看,情況並不樂觀,恐怖襲擊在2012年後有激增的趨勢。

需要說明的是,我不確定這樣的變化趨勢否和監測的技術越來越先進有關;同時,幾十年來,國際上對於恐怖襲擊的定性標準是否有過變化,也有待考證。

Figure 2 和 Figure 3 顯示了總體上每月及每月各日的頻次分布,我們看不出什麼明顯的模式。例如,發生在每月31日的襲擊次數相比其他的日子少了約一半,這與一年中有半數的大月相吻合;總體上看,恐怖襲擊似乎並沒有特定的日期偏好。

Figure 4 進一步將月份和地區結合,以觀察不同地區在各月的恐怖襲擊頻次分布。

當將襲擊發生的具體年月日轉換為相應的周(Figure 5),並進一步考慮地區因素後(Figure 6),我們發現了一個有趣的現象。在Figure 6 中,我們發現在中東/北非,以及南亞地區,恐怖襲擊在周五及周六的發生頻次較低;而在西歐及南美地區,相應的低點則主要出現在周六及周日。這種分布差異在統計也是顯著的。我們發現,恐怖襲擊在周末的發生頻次相對更低,那麼,這是因為怖分子也需要放假休息嗎?還是說,休息日並不是一個實施恐怖襲擊的理想時點?需要說明的是,在中東/北非及南亞地區,有較多的穆斯林國家,穆斯林國家的一周通常始於周日,休息日一般在周五;而西歐和南美地區穆斯林國家很少,休息日基本都是周六和周日。

Figure 7 是一張heatmap,縱軸為緯度,橫軸為地區,色域表示相應地域的恐怖襲擊頻次。我們可以看到,北緯30-40度線之間有一塊顯眼的黃色,對應的地區為中東/北非(通過稍後的分析可以知道主要是中東地區),這一地域在1970-2015年期間的恐怖襲擊頻次超過了3萬次。北緯30度線橫穿四大文明古國,北緯40度線同樣被賦予過諸多傳奇彩色;,但它們還有著陰暗的另一面:近幾十年來,這兩條緯線見證了人類歷史的血雨腥風。

Figure 8 以世界地圖的形式展示了不同國家或地區在恐怖襲擊中的死亡人數分布。不難發現,伊拉克是整個世界的傷口。

在 Figure 9 中,橫軸(人均預期壽命))和縱軸(人均GDP))代表數據在原始數據中並不存在,我們從世界銀行的網站中下載了相關資料,並進行了相應的數據匹配。圖中圓形面積越大,表示某個國家在2014年的恐怖襲擊頻次相對越多,不難發現,戰亂主要集中在亞洲、非洲國家中。那麼,一個自然而然的追問是,人均GDP、人均預期壽命和恐怖襲擊之間存在怎樣的動態演化關係?隨著恐怖襲擊頻數的增加,國家經濟是否會出現下滑甚至崩潰的趨勢?

在 Figure 10 中,我們選擇了十個戰亂較為頻繁的國家,觀察隨著時間的演變,這些國家的人均GDP、人均預期壽命以及恐怖襲擊頻次的變化趨勢。總體上看,多數國家的恐怖襲擊頻次隨著時間的推進都有所增多,而人均GDP和人均預期壽命雖然有所波動,但整體還是呈現上升的態勢。

---------文檔說明-------------

作圖主要用了plotly,它對Python、R、MATLAB及JS都提供了相應的API介面(每天可免費調用250次)。事實上,對plotly庫的語法不熟悉也問題不大;plotly提供了豐富的可視化案例和模版,使用既有的框架,做好數據的清洗和整理,就能做出需要的圖形。

具體的作圖代碼(Python版本)可見:GitHub - bnuFisher/data_vis

推薦閱讀:

python 3.4 下載了PIL第三方模塊,whl格式,如何安裝?
Python中Turtle模塊的基本指令都有哪些?
Project Euler上的程序語言排行為什麼Matlab比Python低那麼多?
PyQt5系列教程(20):液晶顯示屏

TAG:數據可視化 | Python | 恐怖襲擊 |