從南丁格爾玫瑰圖思考科研中的數據可視化
撰文: CCL
編輯: CCL
所屬專欄:鍾老師科學可視化
圖1 南丁格爾玫瑰圖
上面這幅就是著名的南丁格爾玫瑰圖。本文將從一則小故事開始。19世紀中葉,有這樣一個出身歐洲貴族的名媛,弗洛倫斯—南丁格爾,她本可以像當今的卡戴珊、希爾頓、鄧文迪、某茶妹妹等名媛一樣,過著每天各種Shopping、Party、Happy的生活。但這位貴族小姐姐偏偏心繫貧苦大眾、熱愛公共衛生事業,志向是成為一名護士。這本也不奇怪,廣大的貴族團體中總有那麼一些能夠感受到平民生活的水深火熱、並施以憐憫之心,所以她的父母也沒在意,只是認為這個女兒心地善良。
突然有一天,南丁格爾告訴她父母:我接到了上帝的旨意,讓我成為一名護士。要去護士學校學習護理,並準備去克里米亞戰場充當戰地護士。她父母堅決反對,因為當時護士是很低賤一種工作,只是窮人們才會去從事;況且,一個貴族千金要去前線戰場,也很荒謬。但南丁格爾不顧父母的反對,還是毅然決然的學習護理、並率領38名護士於1854年10月前往克里米亞戰爭前線(至此,我開始了對這位小姐姐的崇拜之旅)。
來到前線,南丁格爾發現戰區的醫療衛生情況非常糟糕,大量的受傷士兵因為醫療衛生狀態太差而死於感染,並非直接死於戰爭或者惡劣的自然條件。南丁格爾向英國政府報告這一狀況,並極力要求改善戰區醫院條件。1855年3月英國派出的衛生委員會到達戰區,積極改善醫院醫療衛生狀況,從而顯著降低了英軍的死亡率。
這一改變讓南丁格爾意識到公共醫療衛生的重要性。回到英國,南丁格爾開始收集大量證據、並進行詳細的統計分析,向皇家委員會報告士兵的健康狀況。據此,南丁格爾開始遊說英國政府加強公眾醫療衛生建設和相關投入。
文首的南丁格爾玫瑰圖正是來自於她用於遊說的一篇文章或者報告中。為什麼「南丁格爾玫瑰圖」能夠載入史冊,流傳下來呢?其與普通的柱形圖、餅圖又有什麼區別?這又能給我們的科研中數據作圖帶來哪些啟示?
首先來仔細分析這張圖(其實是兩張),這種圖是極坐標圖,角度來表示月份,圖中不同顏色楔形區域表示不同死亡因素:藍色—— 死於感染(主要由於衛生狀況差所致)、紅色—— 死於戰場重傷、灰色 —— 死於其他原因。這張圖以1855年3月為節點(這正好是英國派出的衛生委員會到達戰區的時間)分為兩個部分。看到這兩幅圖,你的第一印象是什麼,你得到了什麼信息?(在不看下文分析的情況下,看看南丁格爾是不是準備的傳遞了她想表達的信息。)
這兩幅圖傳遞了兩大信息,第一:兩幅圖中藍色部分明顯大於其他部分(這表示大多數的傷亡並非直接來自戰爭,而是來自糟糕醫療環境下的感染)。第二:左邊這幅中的楔形面積遠小於右邊這幅圖(成功展示了醫療衛生改善所帶來的效果)。
那如果以普通的柱狀圖來表示這兩組數據會怎麼樣呢?來自英國的Hugh Small教授在一篇論文中根據玫瑰圖中的數據繪製出了一張普通柱狀圖,如下圖所示:
圖 2 普通柱狀圖
看到這幅圖,你的第一印象又是什麼呢(先想想在再往後閱讀)?
橫坐標也是月份,不同顏色柱狀圖的高度表示不同致死因素的死亡人數。這一普通柱狀圖給人的印象是寒冷冬季的月份士兵的死亡人數特別多?而這一信息是個嚴重的誤導,不是南丁格爾想要傳遞的信息。我相信南丁格爾在統計這一信息、將其可視化成圖的時候,肯定考慮過更為普通的柱狀圖。但因為還是不夠直接,甚至給人以誤導,所以她明智的放棄了傳統柱狀圖。那些掌權的大臣們可沒時間仔細分析圖表,更不能傳遞給她們錯誤的信息。南丁格爾需要的是一張能夠直中要害,一目了然的統計圖。據此,她設計出了著名的「南丁格爾玫瑰圖」。
南丁格爾玫瑰圖的另一個優勢在於利用「面積」取代「長度」來表示死亡人數的多少。換長度為面積,讓每個月之間死亡人數的變化不那麼明顯(長度與面積的區別見下圖3),而又體現出了衛生情況改善前後的變化。
圖 3
南丁格爾玫瑰圖之所以聞名於世,我認為是濃縮了南丁格爾對英國乃至全世界公共醫療衛生建設的重大貢獻。讓政府、權威人士接受新的觀點、或者推翻他們固有的觀點是極其困難的。19世紀中葉,南丁格爾是在與當時的權威階層鬥爭。與權威鬥爭,只講感受、哭訴、義憤填膺是沒有用的,南丁格爾需要用事實、用證據讓當權者信服。而南丁格爾玫瑰圖非常完美的體現了南丁格爾在統計方面的卓越才能和偉大之處,也體現了這一鬥爭過程的艱難。不難想像,這位偉大的女士在法庭上、或者聽證會上,在眾多大臣的目光下,是如何旁徵博引,力挽狂瀾的(至此,崇拜的不要不要的,太厲害了)。
在科研領域,數據圖表、數據可視化的作用同樣也是向同行、向專家、向編輯、向審稿人展現你的發現、你的數據、你的統計結果。編輯,特別是高影響因子期刊的編輯們,每天要處理那麼多稿件,肯定是沒有時間認真閱讀你的文章,很可能只是看看摘要和圖,所以利用文中的圖來有效傳遞信息至關重要。我們能有南丁格爾般睿智么?
下文以科研實例來分析南丁格爾玫瑰圖的應用。
實例:某一反應的傳統催化劑為A催化劑,反應產物分為:產物1,產物2,產物3,產物4這四種。研究發現催化劑A經過某種方法處理後,催化效果明顯提高,在連續反應過程中產率明顯提高,特別是產物1,產物2。現需要做圖體現,對於連續反應,後處理可以明顯提高產率。
我選擇了以下各種作圖方式:
1. 傳統柱狀圖(堆疊柱狀圖),處理前後催化效果放在一張圖中。橫坐標為反應時間,縱坐標為產率。不同顏色表示不同產物。
圖 4
2. 傳統柱狀圖,處理前後分為兩張圖表示。
圖 5
這是我們通常採用的方式,也能夠準確的表達處理前後催化的變化。但有一個缺陷,這兩張圖給人的第一印象可能是隨著反應的進行,催化效果在逐漸下降(而這並不是想表達的重點)。
3. 利用南丁格爾玫瑰圖,角度表示反應時間,面積代表產率。
圖 6
圖6中兩圖對比,處理後,面積明顯增加,特別是紅色(產物1)和綠色(產物2),同時又削弱了產率隨時間下降的印象。
PS:對於每種圖形的喜好與優劣,每個人會不一樣。本文實例主要是提供一種作圖的方式(南丁格爾玫瑰圖),以供大家選擇。
下面以Origin為例,介紹如何繪製南丁格爾玫瑰圖:
1. 選中所需數據,依次選擇Plot – Specialized – Polartheta(x) r(y)作圖,見圖7,圖 8:
圖 7
圖 8
2. 雙擊圖8中坐標數值,出現Axis Dialog對話框。將對話框中Augular Axes欄目下Scale選中,並在右側對話框中將Units改為Custom,下方數值設置為從0 – 220 (反應時間範圍),如圖9所示。繼續在Axis Dialog對話框下,切換到Radial Axes欄目下,選中Scale,並在右側對話框中將坐標範圍改為0 – 100(產率從0 - 100 %),見圖10。修改完成點擊OK,見圖11。
圖 9
圖 10
圖 11
雙擊圖11中折線,出現Plot Details對話框,將左下角的plot type改為column/bar。(注意此時對話框左側選中的項目,圖12標籤1)。
圖12
在PlotDetails對話框下,將左側對話框中的Layer 1激活(見圖13標籤1)。再在右側對話框中選擇Stack,在其下的Offset欄中選中Cumulative,點擊OK,見圖14。
圖13
圖 14
基本作圖步驟完成,進一步美化,效果圖見圖15。
圖 15
最後放一個南丁格爾玫瑰圖原圖,大家一起膜拜一下!
圖 16
相關閱讀:
柱狀圖(Double Y)這麼做!
柱狀圖系列之一:簡單柱狀圖和堆疊柱狀圖(多層)
零基礎Origin教程第六期:圖形美化一
推薦閱讀:
※【3D Max】從孫楊的騷粉色小泳褲到當年的「鯊魚皮」,滿滿都是高科技
※【重磅】圖表繪製與處理的常用軟體
TAG:origin函数绘图软件 | 科研绘图 | 论文插图 |