大數據提升中低收入國家健康水平
原文:http://www.who.int/bulletin/volumes/93/3/14-139022/en/
原作者:1.Rosemary Wyber ,2. Samuel Vaillancourt ,3. William Perry , 4.Priya Mannava , 5.Temitope Folaranmi ,6. Leo Anthony Celi
簡介
無論是對個人還是社會,醫療保健服務都是一項複雜的工作。從臨床角度來說,醫生需要通過病史、體檢、生命體征和其他指標為病人量身定製醫療方案。在21世紀,加強學習、測評以及提升服務質量也被補充到服務指標當中。對數據進行高質量的收集和分析對於提升醫療保健服務的效果和效率至關重要。醫療保健支出中有相當大一部分被浪費在某些臨床情況下對於特定病人的治療方案的不確定。而在基於人口的研究中,干預措施表現得非常成效。然而,在沒有任何監督以及試圖識別其對於患者利弊的情況下實施干預措施著實令人擔憂。在低收入和中等收入國家中,臨床數據的生成、分析和應用是很困難的。考慮到龐大的人口規模以及醫療保健服務驚人的複雜性(數以千計的疾病以及醫藥,包括與其相關的干預措施),利用數據改善具臨床醫學是一項複雜的工作。不過值得期待的是,最近發展起來的能夠收集、分析並應用大規模數據的新方法,即大數據,也許可以填補醫療保健服務和人口健康之間的落差並改善人口健康狀況。這些方法可以收集、組織並概念化數據,為人口健康提供了巨大的可能性。就像醫學成像對患者提供的幫助一樣,這些大數據使得分析更加精確。
近十年,在許多領域中數據的規模迅速擴大,新的數據應用也得到發展。雖然醫療健康領域的數據一直在增加,但是數據在提升醫療保健方面的應用卻缺少相應的改變。因此,開發人員設計了一些原型應用並極力推薦給專業醫療人員。但是到目前為止,他們只獲得了極少數有實際效用的系統性數據。在本文中,我們探討了一些已有的和潛在的應用於中低收入國家的公共健康和醫療保健服務領域中的大數據。我們在PubMed和Embase資料庫以及灰色文獻中檢索了相關文章,並根據所選文章的參考文獻查找了其他來源的相關信息,分析了大數據在醫療健康領域的收益、風險和機遇,並且給出了在中低收入國家醫療健康服務中應用大數據的相關建議。而大數據在基因組學和生命科學中的多種應用由於已有大量報道,故本文沒有涉及。
定義
大數據是指快速收集大量複雜數據的新興方法,數據量級會達到兆位元組、特位元組甚至澤位元組。大數據的特性可以通過數量、速度、種類和真實性四個維度定義。隨著越來越多信息加速累積,大數據的數量和速度也在增加。使用「種類」這個緯度標誌著從多個數據源中收集到的數據可以直接轉化為信息。隨著數據源更加多樣化,大數據成果的價值也逐漸增加。在人口層面,傳統健康數據只包括人口統計信息和入院統計信息,而在過去的幾十年中,有更多的健康數據加入,其中包括電子醫療記錄、手機和購買記錄、地理定位系統和社交媒體等等。「真實性」維度是圍繞數據的不確定性進行收集、標準化和驗證的過程。鑒於對報道數據的量化和清晰度考察是多年來醫療健康領域研究與實踐的一部分,對於醫療行業從業人員來說,其對數據準確性的理解要優於其他許多大數據用戶。在用這些數據撰寫的報告中,報告不確定性和置信區間的做法已經十分普遍。總之,這些維度使得大數據得以應用在醫療健康領域,並通過大型數據集的分析來協助醫療健康側重點和相關政策的制定與實施。
應用
分析來自不同行業的鏈接數據集,可以為改善人口健康狀況提供新機會。例如,在美國北卡羅來納州的達勒姆郡,城市衛生保健部門決定利用數據引導社會和衛生保健服務。他們搭建了一個綜合數據系統用於提高急救和對糖尿病患者醫護的服務質量。通過將地理信息、人口普查數據、納稅情況以及血液鉛濃度進行整合,該綜合數據系統可以用於定位鉛暴露以及其風險評估。通過篩查找出鉛暴露風險較高的區域,有關部門可以發現並應對兒童鉛暴露的問題。這種信息共享與分析可以彌合傳統上公共健康和個人臨床治療之間的鴻溝。
大數據在早期應用於高收入國家時,人們遇到了來自後勤、技術、倫理和管理的挑戰。比如在1998年,冰島政府宣稱健康數據,包括基因數據,都是國家資源,並且可以在未經個人允許的情況下為私人企業使用。然而,國內和國際上的反對阻止任何數據的傳輸,使該項目在2003年流產。貝斯特等人指出,通過世界範圍內精細地對照試驗,50%-80%的電子醫療數據項目都是失敗的。雖然我們已經收集了PB級的數據,但是卻將其束之高閣。
雖然在中低收入國家應用大數據是一項特別複雜的工作,但是這項工作也著巨大的潛在價值。大多數中低收入國家都有控制人類免疫缺陷病毒、肺結核、瘧疾和其他傳染病的縱向方案。這些方案所需的詳細信息由公共衛生工作人員收集。然而由於行業協會外勤人員收集用於報告、追蹤和研究的數據的能力有限,經常不能滿足項目對於信息的需求。這時電子工具的出現正好解決了數據收集方面的質量和供給問題。公共衛生工作人員可以用手機、平板和電腦來實現調查研究和病人護理。
印度雄心勃勃地推出的個人識別方案可謂是大數據在全球健康應用中最有前景的例子之一。從2010年起,印度政府已經為全國12億民眾發放了Aadhaar卡和唯一的識別號。卡片、識別號和相關的生物特徵為大範圍生成和監督衛生和社會數據(包括電子醫療記錄和低收入家庭的醫療保險信息)提供了可能。即使Aadhaar系統停止發展,現有的骨幹網也可以支持更可靠、更龐大的醫療數據服務。反過來,這會使公共衛生干預措施的計劃和實施得到顯著改進。
最近,跨部門數據共享正在刺激大數據快速地創新和發展。例如,在2013年,象牙海岸政府同意公布五個月的匿名手機數據,用於建立流行病傳播的模型。實體企業和政府之間為了公共健康而共享匿名數據這種慈善性質的行為為營利性部門和其他利益相關者之間的合作提供了新的思路。
使用
在中低收入國家中,新技術的傳播通常伴隨著撥款與擴散。與高收入國家不同的是,新技術的傳播經常會跨越式發展。舉例來講,在有線電話網路發展完備之前,手機已經在過去15年間滲透進了中低收入國家。手機的傳播帶來了提升健康服務的機會,並激發了人們對所謂的移動健康或者M-Health項目的熱情。一些小規模的移動健康項目已經被概念式地驗證演示,但是大規模的應用還非常罕見。
大數據和典型的移動健康項目是不同的。總體而言,移動健康項目是相對大眾化的,其准入門檻較低,通過個人手機即可實現。雖然該項目的影響是立竿見影的,但是實際收益十分有限。大數據與之相反,方法本身需要更高的技術水平、專業設備、互動性標準、相干數據收集和分析系統,以及監督管理。除了技術方面,優秀的組織文化也是高效衛生信息系統的主要驅動力之一。然而在大多數國家,醫療保健工作者和系統管理員並沒有受過數據科學的正規培訓。
為了支持良好的數據採集工作,基於固定標準的可互操作的信息系統也需要及時跟進。在高收入國家建立的高度管制和路徑依賴遺留系統導致中低收入國家的相應系統變得支離破碎之前,人們必須制定全球標準。在智能使用數據以支持實證科學的過程中,大數據已經改善了健康狀況,例如在高容量和低成本的印度,Narayana Hrudayalaya醫院已經實施了以結果為導向的數據分析與共享方法。雖然在跨系統整合數據過程中還存有障礙,但是數據所有權正在中低收入國家中萌芽。儲存收集到的健康數據正是這種萌芽的跡象之一。
挑戰
在中低收入國家,全面實施大數據系統還面臨許多挑戰。例如所有大數據方法的前提都是個人信息的採集,然而採集行為卻包含了各種道德、法規和技術問題。鑒於該領域日益複雜的情況,隱私保護的重點將轉向數據的正當使用、風險評估和風險最小化。匿名數據必須被穩健的監管和使用,並且與社會價值觀的發展相一致。此外,在資源匱乏的環境下,應用大數據方法會放大醫療保健服務中業已存在的困境。在一線的衛生工作者在這種環境下很難將他們的管理範圍拓展到數據的非必要集合。一些政客將大數據簡單地看作為中低收入國家準備的消遣,而另一些人則認為大數據是這些國家在進步道路上的一個重要里程碑(box 1)。
Box 1.對大數據的不同觀點
在中低收入國家,未來會因大數據而變好還是變壞?
1、反烏托邦觀點
在最壞的情況是,大數據在高收入國家操控下變成了中低收入國家的一項昂貴的消遣。專註於疾病相關的成果而且使最需要數據存取的相關部門一頭霧水。將難以共享或比較的碎片數據進行同化吸收可能會破壞本就不穩定的全球衛生。數據安全漏洞可能會威脅到人身安全,並導致歧視和種族滅絕等其他暴力行為。所以全球衛生界要監督花費在大數據項目上的巨額支出。
簡要地說,大數據可能帶來以下問題:
?對於需要干預的重心和資源的分流缺乏干預管理;
?不完善的數據管理——由私營公司建立的資料庫頻繁泄漏而公民又無追索權;
?通過設計不當的同意制度同意卸載,這些制度可能會威脅到個人安全;
?缺乏互操作性,分割後的信息系統無法匯總;
以及
?信息表現力差,難以分析,這被視為不合格或不可靠的。
2、烏托邦觀點
與上述相反,大數據時代可以代表全球衛生改善的一個重要而且有益的轉折點。在低收入和中等收入國家的決策者們可能會建立一個「需求方」平台,以確定他們最需要的信息。學術界、產業界、政府、國際組織和非營利部門可以合作幫助提供創新解決方案。雖然理想化的方案非常樂觀,但是它與「實現千年發展目標」,「消除小兒麻痹症」和「控制瘧疾」這些想法同樣野心勃勃。大數據「最佳案例」的發展模式可以幫助我們實現所有目標。
簡要地說,大數據可能帶來如下好處:
?患者將擁有個人的健康數據;
?穩健的管理流程已經發展到能夠保證在使用數據過程中遵守價值標準以及準則規章;
?以少量精力和低成本,實現數據自動匯總;
?互操作性標準支持數據無縫彙集與連接;
?在建立了充分保障的前提下,法律允許實時共享與彙集匿名數據;
以及
?數據對於患者、衛生保健提供者、企業家和政策制定者會呈現一種更有效的模式。
即使在最好的情況下,對個人健康信息的隱私威脅仍然存在。當信息涉及到弱勢群體,這種威脅就更令人擔憂。甚至連基礎的健康數據---例如,種族、生殖健康、性傳播疾病、基因遺傳病和疾病暴露風險---可能被濫用並導致歧視,降低個人安全。任何電子資料庫都有被破解的可能,而有意或無意地違反數據安全的行為更有可能會在高文盲率和社會墮落人群中產生。在這樣的背景下,通過立法來保證信息服務的私密性和安全性通常是不可靠的,而且這種法規很少被有效地執行。
即便在高收入國家,隨著對數據的應用越來越複雜,特定用途的告知授權愈發地被證實毫無意義。隱私保護是每個人的權利,對公信力保護也是非常必要的,隨著大數據改善人類健康狀況的潛力被逐步開發,人們同樣有權利得到其中的潛在利益。而匿名數據的使用需要加入風險最小化的考慮中。因為對數據透明和有效管理的要求越來愈高,傳統同意協議被取代或者補充的需求也日益增大。目標人群的價值觀和需求需要運用於最佳實踐中,以此平衡數據利用的好處和風險.這關係到數據共享和正當利用的順利進行。
大多數低收入國家建立的薄弱的衛生系統和有限的管理架構卻成為了大數據的希望。這些國家非常需要健康指標,但是收集出生和死亡的統計數據卻非常麻煩。這些國家收集的流行病學數據是變數可靠的。數據被小站點收集而且很少被數字化。對於世界上超過二十億的人口來說,當務之急依然是改善食物,水和衛生設施的供給。在許多低收入國家,可能只有在消費實際衛生服務時才能收集相關數據。據聯合國報道,「大數據和實時分析並非解決長久發展問題的靈丹妙藥,認識到這一點很重要。」但是,由於電子化地整合協調資源與服務導致成本降低,大數據可能為中低收入國家帶來巨大的利益,對干預措施資源限制越多,對干預措施的定位和目標就越重要。
垂直(特定疾病)規劃和水平(衛生系統)途徑之間的持續緊張仍然沒有得到解決。大數據更適合水平方案,這有利於潛在地改善所有人類疾病的控制和治療。目前,全球健康仍然受到特定疾病的干擾,而宣傳特定疾病組織能有效地帶頭前往大數據隊列---衛生界分裂的風險更大。
下一階段
大數據收集所扮演的角色---無論是被視為工具或威脅---仍不清楚。對於積極的方面,數據獲悉,反思和資源管理是至關重要的。目前,全球衛生治理架構相對脆弱。在2009年,聯合國設立了全球脈搏行動。「它的使命是採用可持續發展和人道主義行動的方式,加速研究、開發和規模化大數據創新。」不幸的是,全球脈搏當前的數據保護標準非常過時,因為他們以1990年對電腦化個人數據文件的校準作為基礎。
在世界經濟論壇全球健康數據憲章中給出了關於收集和利用健康數據的一些指導。對於健康數據,章程確定了八個主要挑戰,並強調一些扶持性的活動。大數據的廣闊來源需要多個利益相關者的合作。無論是大學,專業協會,政府機構,還是研究驅動型企業,都是可以開發和運營數據系統,以支持醫療機構的例子。這個其中需要一個清晰的治理決策框架,來告知每個利益相關者其義務和在每個進程中的責任。在定位和解決任何問題時都需要透明度,直至重要決策被制定。問題難以解決的原因大多是因為在誰去解決問題,他們應該如何解決問題這些事情上缺乏清晰的共識。比如在一個新興的領域,如大數據,其中的協議仍在發展,管理方式是能使利益相關者相信這裡有能解決問題的系統的重要依據。然而,全球衛生界在技術性發展的管理方面有非常不調和的記錄。優化的大數據應用將包括更多保密保障和最低標準等等。努力建立互操作性標準是勢在必行的,這能最大限度地增加大數據所帶來的好處。全球衛生治理的模式需要從被動的變為主動的,規範的。
結論
在衛生保健服務領域,大數據可能是一個重要的里程碑。它促進了護理學習系統的發展,通過個人精確管理提高了整體健康水平。龐大的規模使得潛在風險和潛在利益並存。雖然大數據方法在中低收入國家中最有價值,但數據碎片化和濫用的風險也蘊含其中。規避風險需要協同治理,認真分析和建立技術合作夥伴關係,這些操作的複雜性不可低估。在中低收入國家,從紙質記錄到PB級數據存儲的過渡指導為全球衛生機構提供了另一個達到有效管理的機會。
參與人員:編譯 – 於大江,徐敏 ;編輯 - 騰翼;策劃 - 徐睿藝、樊茜茜;
推廣 - 吳荃雁、申洪浩、李華芳
轉載聲明:歡迎轉載,請您在轉載時保留署名和引用信息。歡迎您在知乎或微信上關注我們。
http://weixin.qq.com/r/XmKpsQ3EhVD6rUnS9zdM (二維碼自動識別)
推薦閱讀:
※為什麼在發展中國家,警察和軍人往往耀武揚威,目無法紀,橫行霸道?
※如何看待:人民日報稱中國經濟前景光明 成高收入國家無多大懸念?
※如何看待南南合作?
※中國為什麼沒像日本成為發達國家?還有日本為什麼可以從戰敗國經過 30 年左右發展成為發達國家?