醫療保健研究報告

醫藥行業的大數據時代即將到來,未來十年,將會逐漸對行業內產業鏈各個環節產生深遠影響。

「大數據」這一名詞 2012 年在奧巴馬國情咨文中被重點提及,從此為大眾所知,近幾年來發展迅猛,已經在很多行業得到體現,國內比較經典的案例是阿里巴巴利用大數據分析作網路精準營銷,顛覆了傳統零售業。醫藥行業的變革歷來發生較為遲緩,然而即使如此,醫藥數據的積累正在加速進行,我們認為從供給和需求兩方面來看,醫療大數據即將迎來量變到質變的一刻。

生物大數據包羅信息多、價值大,若能有效挖掘,醫藥行業的每個參與方均有望從中受益。「精準醫療」的實現依賴於生物大數據的解讀。美國總統奧巴馬近日提出的「精準醫療」概念、和以往所說的「個性化醫療相似」,指針對同一種病、根據每個患者的不同情況採用不同的臨床路徑。其背後依賴於對各個患者多方面數據的積累,包括各種生物組學數據(基因組、蛋白組等)、患者病史、生活習慣、行為習慣等多方面,對比過往患病人群到相關數據,通過大數據分析,找出最優的治療方案。這一理念的實現,依賴於生物大數據的積累、以及後續對這些數據的挖掘和解讀。

我們認為生物大數據行業會有兩個壁壘: 1)數據的積累; 2)數據的挖掘和解讀。 前者是先進入該子行業的廠家具備的天然優勢,例如華大基因在基因測序積累多年,中國人的基因樣本庫; 23andme 通過對個人服務積累的基因組資料庫等。數據的挖掘和解讀壁壘更高,從美國來看,目前涉足生物大數據處理和分析的公司主要有兩類:一類是傳統的 IT 公司和統計數據處理公司,例如 Google、 IBM、 SAS, 另一類是專職於生物大數據處理的公司,例如 NEXTBIO、 Knome 等。國內目前尚無專職處理生物大數據的公司,未來一定會有這種業態出現。

1. 數據積累 + 技術進步 = 生物大數據時代來臨

1.1. 供給和需求雙輪驅動,生物大數據時代已經到來醫藥行業的大數據時代即將到來

未來十年,將會逐漸對行業內產業鏈各個環節產生深遠影響。「大數據」這一名詞 2012 年在奧巴馬國情咨文中被重點提及,從此為大眾所知,近幾年來發展迅猛,已經在很多行業得到體現,國內比較經典的案例是阿里巴巴利用大數據分析作網路精準營銷,顛覆了傳統零售業。醫藥行業的變革歷來發生較為遲緩,然而即使如此,醫藥數據的積累正在加速進行,我們認為從供給和需求兩方面來看,醫療大數據即將迎來量變到質變的一刻。供給驅動來自於醫療電子數據的積累、數據挖掘手段的提升和移動互聯的普及。

伴隨著電子病歷,二代測序,互聯網醫療,藥品網售、雲存儲這些全新技術平台出現,醫療數據電子化成為可能,醫療大數據的積累正在加速進行。同時移動互聯和智能手機的普及,帶來了全新的醫療、健康理念,獲得患病人群和健康人群的即時監控數據成為可能。

另一方面, GOOGLE、 IBM 這類 IT 龍頭讓數據挖掘、大數據分析的手段日益精進。需求驅動來自於以下方面。 1)醫藥產業鏈中各個環節的效率均有待提升:醫保吃緊,醫生資源緊缺,患者體驗差、不滿升級; 2)「精準醫療/個性化醫療」的需求:不同於以往基於人群統計結果的循證醫學,精準醫療講究「對人下藥」而非「對症下藥」,二代測序技術讓精準醫療成為可能; 3)健康管理&慢病管理的需求:人口老齡化,癌症、心腦血管疾病、糖尿病等慢性病發病率逐年攀升,同時人們的保健意識逐漸蘇醒,帶來健康管理和疾病管理的需求。

1.2. 數據量的積累:量變到質變

醫藥行業是數據密集的行業,數據量正以爆炸式速度增加。按照 IDC Digital Universe Study2012 年的預測,截至 2020 年,人類產生和複製的總數據量將達到 40 萬億 GB,是 2010年的 30 倍。同時數據生成和共享的速度也在迅速增加,導致數據的加速積累。醫藥行業是數據密集的行業,囊括葯企研發,科研進展,醫生診療記錄,患者各種病歷,檢測和用藥記錄,患者大健康數據,付費方(保險)賠償記錄等方方面面。 Intel 在 2013 年預測,到 2020 年,醫療數據也將會積累到萬億 GB 的量級。

1.3. IT 技術的進步讓大數據分析成為可能

1.4. 生物大數據的應用已經存在: IBM Watson

以 IBM 的超級電腦 Watson 為例,生物大數據已經開始被廣泛應用於臨床診斷、醫保分析、癌症研究、健康管理等多個領域。生物大數據的應用並非空中樓閣, Watson 是世界上最大的超級電腦,在大數據分析方面,設計醫藥行業的項目覆蓋十分廣泛,包括與WellPoint 合作進行藥品福利管理和惡性腫瘤的臨床診斷,與 BlueCross 合作進行醫保數據分析,與 Sloan 癌症中心合作進行癌症研究、輔助醫生進行癌症診斷等多個方面。 JP Morgan估計, 2017 年, Watson 的大數據分析可以為 IBM 帶來 20 億美元的收入。

2.生物大數據的來源

生物大數據將主要來源於四個方面:研發數據、診療數據、患者的行為和感官數據和醫保數據。

研發數據主要指葯企或科研機構進行研發獲得的數據。包括葯企從臨床前、 I-III 期臨床、 IV 期臨床、上市後大量人群中進行療效&副作用跟蹤獲得的數據;還包括最新的科研進展。?

診療數據主要指患者在醫院進行就醫行為產生的數據。包括病歷(電子病歷),傳統檢測手段(生化、免疫、 PCR 等)、新興的檢測手段(二代測序、基因晶元等)、醫生的用藥選擇、診療路徑記錄等。?

患者的行為和感官數據指患者自身的、在院外的行為和感官所產生的數據。包括患者的家族病史、服藥的依從性、以及通過各種可穿戴設備&即時監控設備&智能手機採集到的疾病管理、健康管理數據。還包括患者在互聯網上的一些網路行為產生的數據,例如尋醫問葯、與患有交流等。

醫保數據是指一切與付費方相關的審核記錄、報銷記錄。包括參保人的病史、報銷記錄、藥物經濟學評價;同病種下人群診療路徑比對等。

2.1. 診療數據:二代測序讓數據積累實現了質的飛躍

傳統的診斷手段目前依舊是診療數據的主要來源。傳統的院內檢測項目,例如生化診斷、免疫診斷、核酸診斷等,目前依舊體量最大,現階段會是診療數據主要的組成部分。一些新的技術,例如基因晶元、二代測序等,目前由於技術新穎,尚未全面推廣,未來隨著成本下降,對臨床指導作用會越來越強,替代部分傳統的檢測手段是大趨勢。

二代測序(高通量)技術的出現讓全基因組測序得以大範圍進行。

2014 年 Illumina 在 JPMorgan 的大健康年會上宣布利用其二代測序平台,全基因組測序成本降至 1000 美金以下(多年前用一代測序進行人類基因組計劃,成本是 30 億美金/個基因組),同時二代測序的通量遠高於一代測序,自此大範圍的基因組測序成為可能,基因組數據開始迅速積累,逐步為臨床操作和基礎研髮帶來價值。

基因組數據價值極高、存在無限被挖掘的可能性。

基因組數據隱含生命全部密碼,對臨床、科研、研發價值極高,目前 CFDA 已經批准的應用是無創產前篩查,進行試點的有單基因病篩查,未來有望繼續放開癌症早期篩查、癌症臨床用藥指導等後續應用。另一方面,積累足夠多人群基因組資料庫後,基因數據還可以實現幫助葯企提升研發效率、進行疾病預警等功能。

電子病歷的推廣是趨勢,保障診療數據電子化,是大數據分析的前提。

電子病歷電子設備(計算機、健康卡等)保存、管理、傳輸和重現的數字化的病人的醫療記錄。我國衛生部先後在 2010, 2011 發布了關於電子病歷系統的規範和通知文件,近年來已在北京、上海等多個城市廣泛試點,電子病歷取代手寫紙張病歷是趨勢。診療數據電子化是大數據分析的前提條件,屆時臨床全部的診斷結果、醫生的處方行為、臨床的診療路徑和效果都可以在人群範圍內實現集中分析。

2.2. 互聯健康、移動健康登上舞台

大部分可穿戴設備尚未能提供醫療價值,但技術不斷進步,數據會更值得挖掘。 目前的的可穿戴設備、移動健康設備採集的數據有以下幾類:血糖(連續或間斷)、心率、血壓、體重、體溫、睡眠、各種運動數據等。目前大部分的可穿戴設備走的依舊是酷炫娛樂路線,尚無證據證明大部分移動醫療設備所采數據具備臨床價值。 Google 此前披露其智能手機 Project Ara 模型,已經具備心電、呼吸檢測功能,尚有更多功能在開發當中。隨著技術的進步,可穿戴提供的數據質量會更高、穩定性會更好,種類也會更多,其臨床價值會更值得挖掘。

可穿戴的成功案例:WellDoc 的BlueStar,通過FDA 認證,臨床價值明確。WellDoc 的BlueStar 是一款病人主導的糖尿病管理產品,進行了嚴格的臨床實驗證明其臨床價值,是為數不多的通過FDA 認證的移動醫療產品之一,需要醫生開具處方,II 型糖尿病患者才可使用,也側面其已被正規醫療體系所接受。BlueStar 幫助病人進行自主糖尿病管理,可以提供即時血糖、血壓、血脂監測,通過數據處理為醫生臨床決斷給出建議;還可以給病人進行健康管理提醒。BlueStar 的成功也證明了可穿戴設備確實可以帶來臨床價值,其數據也值得積累和挖掘。

網路和移動互聯的普及,患者行為將互聯網化和數字化,提供新一維度的大數據。2014年是互聯網衝擊醫藥行業的元年,阿里巴巴力推未來醫院、網路問診平台春雨醫生融資、處方葯網售放開傳聞。隨著網路普及,部分就醫、購藥行為向網路端轉移是必然趨勢。然而更早的時候開始,部分患者已經會在網路上詢問病情,患者尋醫問葯的行為網路化和數字化,為生物大數據增添了一個新維度。未來通過網路搜索+大數據分析做流行病學預測,精準推薦尋醫購葯信息在技術上都是可行的。

2.3. 研發大數據提升研發效率

研發數據包含了葯企目前所有臨床前、臨床的研發數據、科研機構進行基礎研究的研發數據、以及藥品上市後,後續對藥效和安全性進行跟蹤的相關數據。遠期來看,互聯網、雲存儲、大數據會帶來葯企研發模式的變革,有望提升新葯研發效率。在這一領域尚處於願景階段,部分巨頭跨國葯企已經開始有所嘗試:GSK 2013 年和統計巨頭SAS 合作開展葯企R&D 數據公開的項目,旨在通過分享經驗,加緊和科研界的合作,避免業內重複研發、資源浪費的情況。醫藥大數據助力研發的另一個方向是希望通過對產品上市後用藥人群分析,檢測其療效、副作用,來指導臨床前分子實體的篩選,從而達到提高研發成功率的目的。

3. 生物大數據潛在應用廣泛

生物大數據包羅信息多、價值大,若能有效挖掘,醫藥行業的每個參與方均有望從中受益。

臨床決策支持,「精準醫療」的實現依賴於生物大數據的解讀。美國總統奧巴馬近日提出的「精準醫療」概念、和以往所說的「個性化醫療相似」,指針對同一種病、根據每個患者的不同情況採用不同的臨床路徑。其背後依賴於對各個患者多方面數據的積累,包括各種生物組學數據(基因組、蛋白組等)、患者病史、生活習慣、行為習慣等多方面,對比過往患病人群到相關數據,通過大數據分析,找出最優的治療方案。這一理念的實現,依賴於生物大數據的積累、以及後續對這些數據的挖掘和解讀。

生物大數據可幫助患者更好的進行健康管理和疾病管理。健康管理和疾病管理在我國剛剛起步,考慮到人口老齡化、慢性病發病率升高、居民健康意識提升等多方面因素,未來是極有潛力的市場。大數據模式下的健康管理和疾病管理,通過收集對象的健康檔案、疾病檔案、生活狀態、睡眠質量、心理表現等生理或心理方面的行為數據,進行分析、處理,監測該對象的身體狀態,通過行為干預,幫助人們改善不合理的行為習慣,實現積極健康的生活方式。

幫助提升葯企研發效率。大數據可以從多方面提升醫藥行業的研發效率:

1)各種組學數據的積累,推動最上游基礎科學的研究,包括了解疾病分子機理、開發新靶點、新技術等,下游產業研發收益於上游知識的進步;

2)葯企臨床研究過程中,通過大數據分析尋找最適宜的病人作為臨床對象,提高藥品應答率,節約不必要的時間、經費成本;

3)藥品上市後,通過對產品在實際應用的大批量患者中的有效率和副反應率相關數據的積累和挖掘,反饋給研發管道上游,及早發現潛力項目。?

患者行為通過互聯網數字化和網路化,有效的數據挖掘對公共健康管理價值無限。互聯網和移動端的普及,越來越多的患者開始通過網路尋醫問葯,搜索行為、購買行為、地域分布這些信息本身構成了新一維度的生物大數據。大型搜索平台如 google,已可以實現通過各地人群搜索行為本身進行流行病學預警;國內也有如阿里巴巴這樣的企業通過終端過往購買行為、瀏覽行為的數據分析後進行精準營銷。隨著互聯網逐漸滲透到醫藥行業的每個角落,積累數據的挖掘潛力值得期待。?

生物大數據有望為保險公司提供有效的控費手段。保險公司從產品開發、精準營銷、風險評估、核保核賠、控費等多角度均可受益於大數據分析。

3.1. 「精準醫療」的核心是生物大數據分析

精準醫療和循證醫療的核心區別在於精準醫療是依據個體的生物大數據設計臨床方案。傳統的循證醫學,是針對同一病種患病群體的大概率解決方案(循證醫學在患同一病種的患者中進行試驗,採用的是可以治療大部分患者的解決方案並作為此類病種全部人群的標準解決方案),忽視每個病人的個體差異。個性化醫療或精準醫療的理念,是力求綜合考慮每個患者的全部信息(目前對臨床上有直接指導意義的是基因靶點信息,未來希望可以包括進含基因組蛋白質組在內的其它「組學」、患者的生活習性、過往病史、家族基因譜、甚至是最新的研發進展等多方面信息),綜合分析以後提出解決方案。因此精準醫療得以實現的核心,在於積累患者各方面的生物大數據,還在於建立起這些生物大數據和疾病、疾病解決方案之間的聯繫,即數據的解讀也是關鍵。

精準醫療的美股標的「Foundation Medicine」業務流程核心步驟是基因組大數據採集和分析。 Foundation Medicine 通過二代高通量測序採集患者基因組數據,通過特定演算法進行突變分析(點突變、 In/Del、拷貝數異常、重組等),將獲得的突變進行在已有基因資料庫中進行儘可能解讀,最終給出臨床建議,輔助醫生設定治療方案。

基因組大數據目前最主要的應用領域是癌症。 目前除了部分癌症外,別的病種尚未能將基因突變和下游疾病發生、疾病治療方案建立起直接聯繫,因此目前基因組大數據最主要的應用領域是癌症。通過對癌症患者基因組/外顯子組進行全測序分析,尋找可能致病的突變,設計相應的靶向治療方案。 Foundation Medicine 已推出包含 280+種基因突變篩查的試劑盒 FoundationOne,利用高通量測序,一把檢測目前已知的全部可能致癌的突變,尋找疾病根源。其它病種,由於基因突變和疾病之間並無簡單直接因果關係或具體聯繫尚未被知曉,基因組大數據應用的全面推廣需要一定時間。

越來越多靶向治療的出現讓精準醫療越發重要。 靶向治療是癌症等疾病治療方案的主要發展方向之一,隨著人們對癌症的分子分型越來越詳細、越來越多的靶向療法推向世面(替尼類小分子新靶點、抗體耦聯毒素、免疫檢查點抑製劑等),通過基因測序尋找致病突變、設計合適的靶向療法,精準醫療也會變得更加重要。

3.2. 移動醫療會成為醫療的重要組成部分

移動醫療對於慢病管理、健康管理的價值是毋庸臵疑的。 儘管目前大部分移動 APP 尚處於探索階段、能夠採集的數據種類比較局限,數據的臨床價值不明確,也已經出現了如WellDoc 這樣的成功案例。 PwC2015 年針對美國 1000 名醫生和患者的問卷顯示, 86%的醫生相信未來 5 年移動手機 APP 會成為協助病人做健康管理的重要手段。

3.3. 公共健康:流行病學預測

生物大數據可對流行病學做出指引。 例如:針對特定種族多人次的基因組分析比對可以預測疾病易感性,對人群在網路端相關行為數據進行分析可以掌控流感疫情進展等。Google 已經成功依據美國民眾搜索行為預測了流感疫情; Twitter 也根據各地人微博文風預測當地心臟病風險,所得結果均和疾控中心公布的實際結果高度吻合。

3.4. 保險公司全面受益

生物大數據有望為保險公司提供有效的控費手段。保險公司從產品開發、精準營銷、風險評估、核保核賠、控費等多角度均可受益於大數據分析。

產品開發:根據各地流行病學數據、患者在網路端搜索數據進行潛在需求分析,有針對性的進行產品開發。

精準營銷:依據需求分析,將特定的產品有針對性的營銷給相應的單位和個人。

風險評估:對潛在投保人員健康數據、基因數據的掌握,讓保險公司一定程度上可以進行風險評估,制定相應的保費標準。

核保核賠:擁有特定病種群體的臨床路徑數據、用藥數據等,制定合理的核保核賠標準。

控費:美國PBM(藥品福利管理)模式可以成功控費的原因之一是輔助醫生和藥劑師進行了臨床路徑優化和用藥選擇的優化,國內保險公司目前尚且無法做到這一點,然而大量的數據已經開始被積累,這一模式誕生只是時間問題。

3.5. 助力醫藥行業研發

醫藥行業的研發,從上游基礎科學的研發,至於下游葯企產品開發,均可從生物大數據的積累和分析中獲得價值。?

對於製藥企業來說,臨床藥物基因組學的研究可以增進對候選葯機理和安全性的了解;臨床試驗中,通過基因圖譜篩選最有可能對藥物產生應答的試驗對象、提高藥物的應答率、節約時間和經費成本,提高研發效率;藥品上市以後,追蹤大範圍用藥患者(而不是臨床中有限的幾百例案例)在真實臨床環境下對藥物的應答率和副反應率數據,總結經驗,反饋給上游研發,指導早期化合物篩選。

生物大數據也可推進基礎研究的加速進展。多個葯企已經開始和研究機構合作,進行各種組學、電子病歷等多累生物大數據的搜集、整合、分析,力圖推進基礎研究的進展。上游知識的積累無疑會帶動下游企業研發步入新的高度。

4. 生物大數據的價值無窮

由於生物大數據有潛力為醫藥行業每個參與方都帶來價值,數據本身存在無窮被挖掘的可能性,價值無法估量。作為簡單的參考,麥肯錫2010 年測算顯示,綜合考慮醫療大數據可以為醫藥行業各個環節帶來的改進,累計有望帶來3330 億美金的價值。千億美金數量級價值的實現有賴於數據的積累和挖掘。

生物大數據的價值在境外已開始被資本追逐。除了著名的基因檢測公司23andme 曾獲google 多倫投資外,羅氏、葯明康德、安進近期都有涉及生物大數據的收購。標的均是積累多年的基因檢測、基因數據處理公司,標的的核心價值都在於資料庫和數據挖掘演算法。

5. 數據的積累和挖掘是大數據行業的壁壘

我們認為生物大數據行業會有兩個壁壘:1)數據的積累;2)數據的挖掘和解讀。前者是先進入該子行業的廠家具備的天然優勢,例如華大基因在基因測序積累多年,中國人的基因樣本庫,23andme 通過對個人服務積累的基因組資料庫等。數據的挖掘和解讀壁壘更高,從美國來看,目前涉足生物大數據處理和分析的公司主要有兩類:一類是傳統的IT 公司和統計數據處理公司,例如Google、IBM、SAS, 另一類是專職於生物大數據處理的公司,例如NEXTBIO、Knome 等。國內目前尚無專職處理生物大數據的公司,未來一定會有這種業態出現。

推薦閱讀:

【分享】乳腺癌治療研究綜述
轉載:中藥石斛的應用歷史演變及本草學研究(作者順慶生)
數額認識錯誤的盜竊行為之定性研究(陳興良)(4)
英國科學家研究稱漂亮父母頭胎更易生女兒

TAG:醫療 | 研究報告 | 保健 | 醫療保健 | 報告 | 研究 |