標籤:

中華放射學會全國委員張敏鳴:建立標準資料庫對人工智慧發展有著基礎性和前瞻性意義

在剛剛結束的中華醫學會第24次全國放射學學術大會上,國內醫療影像領域的醫生專家們聯合國內醫療人工智慧領域的領軍企業依圖醫療,共同建立人工智慧醫學影像標準。

這些醫生專家們包括第二軍醫大學長征醫院影像醫學與核醫學科主任劉士遠教授,北京醫院放射科主任兼醫學影像中心主任陳敏教授,浙江大學醫學院附屬第二醫院放射科主任張敏鳴教授,華中科技大學同濟醫學院附屬協和醫院放射診斷科主任韓萍教授,大連大學附屬中山醫院副院長伍建林教授,浙江省人民醫院放射科主任龔向陽教授等。

合影

醫學影像標準到底有多重要,為何能夠聚合這一眾醫療影像界的專家醫生?醫學影像標準的建立又對整個中國醫療人工智慧的發展意味著什麼?對臨床醫生們來說,又該如何參與到標準的建立中去?

帶著這一系列問題,我們採訪了其中一位醫生專家張敏鳴教授。以下內容來自動脈網與張敏鳴教授的採訪,文章以第一人稱敘述。

張敏鳴教授:浙江大學影像醫學與核醫學專業學科帶頭人,博士生導師。現任中國醫師協會放射醫師分會全國常委、中華放射學會全國委員、中華醫學會放射學分會磁共振專委會副主任委員、浙江省醫學會放射學分會侯任主任委員、浙江生物醫學工程學會放射學專業委員會主任委員。

張敏鳴教授

>>>>AI需要一個前瞻性的標準資料庫

企業剛開始從事醫療人工智慧研究的時候,大多數是先從網上下載或者購買數據,關注如何建模、如何計算。所謂醫學人工智慧大賽,更多的理解為技術競賽,很少有醫生參與。我們臨床醫生大多是看熱鬧的旁觀者。

另外那個時候這些公司產品的證據來源,機器學習的數據質量也讓人擔心。因為一位傻老師、一本傻教材永遠教不出優秀學生。如果一個企業開發醫療人工智慧產品,沒有臨床醫生參與,沒有從臨床的角度出發來提出問題、按臨床需求處理數據的話,那麼這個公司的產品將是沒有靈魂,不能落地的臨床醫生、放射科大夫參與到人工智慧的整個大潮流當中去發揮它應有的作用,是賦予整個潮流的一個中軸的靈魂作用。

這個作用就是提出臨床問題、對數據納入制定標準,對高質量標準化數據納入把關,完善資料庫構建。

人是一個很複雜的生物,並不像計算機語言那樣只有一或者是二。中國醫療數據標準化面臨的一個非常重要的挑戰就是,中國醫療體系非常複雜,各家醫院有自己的醫療特色和診療目標,有各自的圖像掃描標準

以肺部CT檢查為例,基層醫院只關注來檢查的人員是否有病,而三甲醫院還要關注患者是什麼病,患病程度,下一步的治療方案,不同的標準導致設計的檢查方案就完全不一樣。

我十分看好人工智慧,我相信將來的發展肯定不止簡單的判斷患病與否,而是判斷疾病的良性惡性、疾病的程度,並給出下一步的治療策略。但這些都需要基於一個標準化的數據來實現的。

另一方面,在談論數據標準化的時候,首先我們要設立一個前提,考慮產品將來的用途,具體解決什麼問題。而不是盲目地追求又快又准。

具體來說,首先企業知道自己要做什麼,企業制定出標準,然後將標準細化,以肺部為例,具體到CT掃描的厚度、解析度、方式,三維重建、放射組學等,然後在這個基礎上做大樣本的數據搜集。

很多人工智慧公司目前只是關注肺部結節、腫瘤,其實它在其他領域也有巨大前景,甚至能發現超越我們所認知的東西。比如說神經退行性疾病,可以利用標準數據建立人工智慧模型,來識別臨床前期的癥狀,幫助我們看見人類看不到的微弱的疾病早期變化。

人工智慧發現醫生看不見、摸不著的變化,預測疾病的發生,這是美好願景。如果AI可以發展到那一步,那麼現在的標準就非常重要,我們應該要有一個整體的宏觀設計,這樣可以避免每個階段都重新採集數據。

因為數據採集是一個非常艱難的過程,我們要有一個前瞻性的數據採集設計,來構建資料庫以及制定前瞻性的行業數據標準。

>>>>前瞻性數據標準要包含多重數據

以肺結節為例,除了需要標準圖像數據以外,還需要有患者的流行病學數據、實驗室檢查數據、甚至基因數據,以及治療過程當中的診療數據。如果某家企業在研發這些產品的過程中擁有如此全面的數據,這家人工智慧公司是很有前景的,它走完了第一步以後,可以迅速走出第二步,不然從第二步開始又要重新數據採集、積累。

而標準資料庫的建立僅憑公司是做不出來的,一定要有放射科醫生人士來參與,這種參與不是僅僅與機器比拼一下準確率,而是參與到產品的研發過程中。

>>>>建立標準資料庫是可行的,不是空談

建立標準資料庫絕對是有必要的,掌握數據的這一部分專家有責任和義務來組織建立一個大的標準資料庫,資料庫要包含多數大醫院、各個硬體公司產生的數據,並儘可能形成標準,供各個人工智慧公司訓練模型的時候使用

有人說這個資料庫是空談,其實我們已經在做了。我們在浙江省的多個中心做大腦的神經退行性疾病的標準資料庫。在國家科技部重點研發計劃「十三五」課題計劃的推動下,我們已經在十幾個醫院開展研究,參與者包括神經科大夫、放射科大夫。數據也來自不同的設備。

我們對神經性退行性疾病多模態的影像掃描做了標準化,而且對於不同的設備,會按照這個標準來儘可能彌合。

這個資料庫包括患者的疾病過程,認知的評分過程,量表的評分過程,大腦的圖像以及用藥過程和患者的基因數據。目前已經通過社區調查了幾千例的正常老人,他們目前沒有患病,我們通過記錄老人的生活習慣、量表評分來發現老人患病傾向,然後再給這些人做一個標準的大腦掃描,掃描以後進行前瞻性的追蹤,觀察病人發展方向,這樣一套數據搜集以後,建立一套人工智慧模型,就可用於預測其他人的發病概率

又因為我們有完整的基因、圖像、臨床數據,也可研究神經退行性疾病的發病原因,這個意義就更大了。我們建立的資料庫將會成為人工智慧各領域建立資料庫的一個範式。

另外需要強調的一點就是,我們的標準要依照國際指南、文獻以及臨床知識背景深厚的專家的看法,這樣的標準才有公信力。

>>>>數據安全、法律規範不容忽視

所有的醫療大數據納入研究醫療之外的、他用的過程,患者是要簽署在知情同意書,這是患者的權利。

我預測將來,如果這份規範做好的話,所有的病人進入醫院進行檢查的時候,患者都會簽署知情同意書,同意自己的數據用於科學研究,而不是商用。目前我們還沒有做到,但是國外已經在注意這個問題

目前中國行業的情況是,雖然明確的法規還沒有出來,但是在科研的過程中我們會進行脫敏,去掉個人信息,用標號代替,保留臨床數據用於科研。現在有爭議的點是姓名是敏感信息,那麼年齡、生活習慣、性別、生活地域這些算不算敏感信息,這目前還沒有界定,但是如果去掉這些信息,會對科研造成很大的影響。

總的來說,醫療是很複雜的學科,它牽扯到法律、倫理、技術等等方面,所以要想做好這件事情,就需要一個權威的部門,充分討論、徵求意見之後,作為建立大數據的規範。

>>>>資料庫的建立可能需要政府、醫院、企業的共同參與

和全國各大頂級三家醫院一樣, 我們醫院審核一家企業,讓企業進入我們醫院都是很難的,要簽署保密協議,數據用途等一系列的協議,獲得的數據越是優質,門檻就越高。企業使用數據需要醫院的醫務部門、IT部門等部門的同意,並經院務會討論,而且數據還不能出醫院,依圖是通過了重重審查才進入到我們醫院,並且系統已經進入推廣階段。 另外,資料庫的建立,需要多家醫院的數據輸入,最終達到數據共享,但是別人未必願意,此時就需要上層設計。

我希望形成一個聯盟一樣的組織,在政府授權或者認可的前提下,建立一個類似數據銀行的機構,各家醫院需要共享自己的數據,數據的所有權歸聯盟所有,企業也可以從數據銀行獲得優質的大數據。

與依圖科技的合作也是慎重思考之後決定的。依圖有自己的技術背景,而且動作很快,有時候甚至趕不上他們的節奏。另外依圖科技畢竟是企業,它進行科研轉化的能力比我們強,但是不著急賺錢,想把產品做好,要不然我們也合作不來。

這個資料庫前期可能是國家支持,但是它的維護需要企業的支持。需要強調的是這個資料庫的建立應該是以公益和科研為目的。也許未來這個資料庫會公開,就像國際上的公開資料庫一樣。也有可能是參與創建資料庫的企業免費試用,其他企業付費使用,但是收費也僅是為了維持資料庫的運營。

>>>>樣本量越大,結果越準確

從統計學的角度來說,樣本量越大,誤差就會越小,如果企業有精準的數據,那麼樣本量可以小一點,如果不是精準的數據,企業必須要擴大樣本量,所以現在也不能說在沒有標準資料庫的情況下,企業的系統落地完全不可行,但是要在不斷地擴大樣本量的基礎上做這件事情,需要花費很大精力。

另外,我是一個做科研的人,科研和現實是有差別的,不可否認大的樣本量和不同的數據來源可以更加真實模擬現實中的狀態,而做研究的時候要去掉很多干擾因素,但是現實中干擾因素去不掉。而什麼因素需要去掉,什麼因素需要保留,這需要專家和一線醫生來決定,甚至是做對照實驗來決定。總的來說,建立標準資料庫對人工智慧發展起到的是基礎性和前瞻性的作用。

推薦閱讀:

如何判定自己是否適合做產品經理?
二爺 & 梁寧,兩個要一起買才最好
滴答清單產品體驗報告
To Be A Product Manager | Week 54
主流CRM系統體驗報告 :銷售易、紛享銷客、愛客CRM

TAG:產品經理 |