醫療大數據行業整理
5 人贊了文章
一、行業知識:
大數據的處理流程是利用多個資料庫來接受發自客戶端的數據,並且可以通過這些資料庫來進行監督的查詢和處理工作。將海量的來自前端的數據快速導入到一個集中的大型分散式資料庫(或者分散式存儲集群),並且可以在導入的基礎上做一些簡單的清洗和預處理工作,然後進行普通分析和分類匯總等,已滿足大多數的分析需求。
醫療大數據的來源:1.製藥企業/生命科學:中小型的藥物研發企業也在TB以上的。基因圖譜(基因組序列約750MB);2.臨床醫療/實驗室數據:普通CT圖像含有約150MB,標準病理圖5GB;3.費用報銷/醫保信息;4.健康管理
醫療數據分析除了數據分析挖掘演算法、人工智慧模型外,還需要專門的知識庫體系,在醫學本體之上構建知識圖譜、在圖譜之上構建數據分析模型、在模型之上構建應用產品,層層遞進。
應用:1. 臨床運營 (精準治療、決策輔助、比較效果研究、運營透明、遠程監控、檔案先進分析—易感人群/持續了解);2.支付/定價(提高對假藥和醫療保險欺詐的自動識別、精準劃分醫療保險/經濟補償支付額度、定價計劃);3.研究開發(預測模型、新葯預算/療效/市場期待/副作用、量化流程、臨床實驗設計、私人訂製藥物、個性化治療、疾病爆發周期和趨勢預測—調整生產能力/減少庫存積壓/降低職工流轉);4.新的商業模式(可能出現專業聚合/綜合病人臨床記錄的公司、在線醫療平台和互動社區);5.公共健康(控制傳染病流行)
政策:《國務院辦公廳關於促進和規範健康醫療大數據應用發展指導意見》、《國務院關於整合城鄉居民基本醫療保險制度的意見》、《國務院印發促進大數據發展行動綱要通知》--醫療大數據納入國家戰略;人社部《關於全面推進基本醫療保險醫療服務智能監控》
二、關鍵點:
l 醫療數據目前存在數據分散、非結構化、複雜性、描述標準不統一等問題。E.g. ICD-10標準有2萬種疾病,但實際上一個醫院的一個科室,醫生對疾病的寫法就有4萬多種。(中國的絕大部分臨床病歷實際價值非常的小。因為醫生的臨床工作很忙,所以基層醫院的病歷寫作不規範,而上級三甲醫院的病歷基本上都靠複製黏貼。
l 商業模式單一:變現模式很長時間是to B的。1.通過醫院向患者收費,每個醫院和科室相當於一個代理,毛利率低;2.葯企數據輔助分析,國內原研葯市場份額不高投入不大(大數據企業可能需要花費上億的成本去做臨床數據輔助分析系統,但葯企可能只願話幾百萬支付服務費用,導致入不敷出)
三、行業布局:
四、問題:
l 通常情況下,(三甲醫院)每年大數據建設預算是什麼量級?
l 有哪些產品?針對哪些應用場景?
l 數據源層面,對接了哪些醫院系統?數據質量如何?(醫院系統包括HIS-醫院信息系統、LIS-檢驗信息系統、PACS-醫學影像存檔和傳輸系統、EMR-電子病歷,另外還包括護理系統等,以及部分科室自建的系統)
l XXX的演算法模型,大概需要多少數據?
l 數據的存儲?擴展能力(如何管理文件系統層累積的元數據)?延遲問題(實時處理、秒級查詢需求響應)?並發訪問(同時使用多種數據,但數據可能存儲在多個地點多種不同設備上)
l 知識圖譜建設需要多久?
l 有哪些重點客群?
l 服務客戶時,是否有側重的細分領域?(健康醫療大數據產業是典型的規模效應)
l 通常情況下,部署周期需要多久?
推薦閱讀:
※醫院告知不足,患者肺功能嚴重受損,院方承擔次要責任
※中醫特別醫療常規診療法
※一張圖告訴你全國頂尖醫療信息
※什麼是醫療器械維修工程師