【疫苗數據圖】根據衛建委(衛計委)百日咳發病數據做出一些澄清

【疫苗數據圖】根據衛建委(衛計委)百日咳發病數據做出一些澄清

來自專欄數據與社會 by Yiqin Fu207 人贊了文章

在一片轉發近萬次的微博中,微博 po 主引用衛建委(衛計委)每月公布的傳染病數據,指出百日咳發病人數今年較往年有較大增長。我們把每年每月的數據畫出來後,發現的確是這樣:??

結合最近的新聞看,確實很讓人擔憂——問題疫苗有許多是百日咳疫苗,微博原 po 和評論區幾乎所有人都認定或暗示疫苗是發病數上升的主要原因。

在下結論前,我們先來看美國疾控中心(CDC)提供的美國發病數據:??

很明顯可以看出:??

  1. 美國百日咳近三十年的大趨勢是發病數增加
  2. 美國百日咳發病人數年與年間的變化特別大,最近十年的峰值(2012 年)是谷值(2007 年)的近 5 倍。

對此,美國疾控中心是這麼解釋的:

  • 百日咳天生有周期性,該病大約 3-5 年出現一次發病高峰
  • 發病高峰近來變得越來越「高」,主要因為以下幾個原因:民眾對該疾病的了解增加、診斷測試水平提高、地方數據上報更全面準確、百日咳細菌傳播更廣泛、人群免疫下降

?由此,我們知道,如果某地區百日咳發病人數較同期翻了一倍(中國 2018 年的情況),?那麼除了疫苗可能有部分未達標,還可能是因為百日咳天生的周期性、民眾對該疾病更多的了解、診斷技術的提高、病例上報的完善等其他原因。至於上述因素哪些現在存在、哪些是主因,我們手上的數據並不能給出答案。

此外,我們把中美數據畫在一張圖後,會發現一個奇怪的現象:??

可以看出,美國發病數是中國的 3 - 10 倍。再考慮到美國人口是中國的 1/4,?所以美國的百日咳發病率大約是中國的 10 - 40 倍。(我查到的資料說百日咳不會特別出現在某個年齡層中,所以本文使用的人口基數是各地區的總人口。)?

?就算美國傳染病預防做得再差,發病率一直是中國的幾十倍,也挺蹊蹺。

我是學社會科學的,看到上圖,我第一反應是這種情況很像社會科學裡「北歐性騷擾案發率最高」這個現象——北歐相對其他國家性別更平等,所以受害民眾更願意報案、警方更願意立案,所以性別更平等的地方(例如北歐)性騷擾案發率反而更高。我猜在百日咳問題上,美國發病率是中國的幾十倍,也很大程度上是因為美國民眾對該病更了解,且檢測技術更好、覆蓋範圍更廣。

我做上面這段展開,就是想給中國今年的百日咳發病數上升加一點背景資料。如果要把上升主要歸結於疫苗問題,還需要很多其他數據。?就現有證據來看,百日咳「天然」的周期性、更好的診斷技術都是可能的「主因」。

?最後,我去幾個人口大省的衛計委網站找了各省的數據。很遺憾的是,山西、河北、江蘇並沒有公布各病種?每月的發病數。?唯一兩個我找到數據的省份(四川、山東)也只公布到 2016 或 2017 年,?所以我們無法通過對比歷史數據來分析它們 2018 年的突然上升是否只是周期性的「自然」上升。

山東

四川

最後,可能你也注意到了,人口相似省份的發病數差異很大。2017 年,

  • ?山東人口約 1 億,發病數 3843
  • 四川人口約 8000 萬,發病數 479
  • 江蘇人口約 7800 萬,發病數 61(我們沒有江蘇的月度數據,但有一個 2017 年的總數)

省與省之間縱使經濟發展水平差異再大,發病率有 5 - 10 倍的差異,也很奇怪。聯想起最近的新聞,難免又讓人感到擔憂。不過,還是像之前說的那樣,差異可能由很多因素導致。除了上面提到的那些,影響因素還包括:

  • 各地區確診標準可能不同
  • 各地區疫苗的普及程度不同

我不是流行病學專家,不過社會科學裡也經常需要做因果推斷。在百日咳問題上,把發病上升的主因不經仔細分析就認定為疫苗有效成分不達標,極不科學。

當然,疫苗問題是嚴肅、重大的民生問題,即使它不是 2018 年發病人數上升的主因,可能也是影響因素之一。有關部門決定對疫苗進行抽檢,可能也是因為注意到了百日咳發病數的上升。不過,我們在「用數據說話」的時候還是要謹慎再謹慎,特別是如果你的結論包含因果關係。用不充分的數據製造恐慌,確實沒有必要,也不負責任。

本文拋磚引玉,希望流行病學專家批評指正。?


?最後附上大家可能感興趣的一些傳染病數據:


推薦閱讀:

【翻譯】《利用Python進行數據分析·第2版》第11章(中) 時間序列
種一棵樹最好的時間是十年前,而後是現在
滴滴出行分析師十條
同業分析工具(excel)3.0版
數據報告tips

TAG:疫苗 | 數據分析 | 健康 |