巨變端倪:人工智慧在醫療影像診斷領域全面爆發丨奇點猛科技
近兩年來,無論是在語音識別、圖像識別還是文本理解,深度學習在醫療領域都有超乎想像的突破。
在語音識別領域,梅奧診所與以色列語音分析公司Beyond Verbal合作的研究發現13個語音特徵和冠心病存在相關性,其中一個語音特徵與冠心病存在強相關。
在自然語言處理領域,IBM的沃森機器人能夠在17秒內,閱讀3469本醫學專著,248000篇論文,69種治療方案,61540次實驗數據,106000份臨床報告,並根據醫生輸入的病人指標信息,最終提出優選的個性化治療方案。
與此同時,伴隨著計算機視覺的技術進步,深度學習技術在醫療影像領域頻頻取得重大突破,人工智慧除了教會機器如何「聽懂」和「讀懂」,更能教會機器「看懂」我們的世界,並在此基礎上協助醫生診斷疾病。醫療數據中有超過90%的數據來自醫療影像,醫療影像領域擁有孕育深度學習的海量數據,也存在著藉助深度學習提高醫生「看片子」診斷的效率的需求。因此,在醫療影像領域,深度學習可能率先進入臨床階段。
13萬張圖像的訓練下,深度學習識別皮膚癌的準確率媲美人類醫生皮膚癌是人類最常見的惡性腫瘤,雖然它們出現在皮膚表面,但人們往往將其誤認為是自然生長的「痣」,耽誤病情,確診後已為時過晚。奇點糕還記得,電影《非誠勿擾2》裡面,孫紅雷飾演的李香山從小就長出來的一顆黑痣轉變成了惡性的黑色素瘤,最終不堪絕症折磨的他選擇跳海自殺。
早期檢測到的黑色素瘤的 5 年生存率在 97% 左右,如果晚期查出 5 年生存率將會下降 14%,皮膚癌的早期發現可能會對其結果產生巨大的影響。對於皮膚癌的篩查,主要是通過視覺診斷。一般先進行臨床篩查,之後可能進行皮膚鏡分析、活檢和組織病理學研究。那麼有沒有一種更簡單地方法篩查皮膚癌呢?或者說,能不能利用智能手機篩查皮膚癌?
藉助深度卷積神經網路(CNN)技術,斯坦福大學的研究者讓這個設想更進一步:研究者們在谷歌用於識別貓和狗演算法的基礎上,經過13萬張皮膚病變的圖像訓練後,可用於識別皮膚癌。該系統與21位皮膚科醫生進行的2輪的對比測試:角質細胞癌與良性脂溢性角化病,以及惡性黑色素瘤和普通的痣。第一輪代表最常見的癌症識別,第二輪代表了最致命的皮膚癌識別。深度卷積神經網路在這兩個任務上的表現都達到了所有接受測試的專家的水平,證明了這一人工智慧系統的皮膚癌鑒定水平與皮膚科醫生相當。這一研究成果發表在2017年1月份的Nature期刊上。【1】
研究者並不止步於此,他們希望在智能手機上也應用該系統。論文的主要作者之一、Thrun 實驗室的研究生Andre Esteva說:「現在每個人口袋中都有一個超級計算機,上面有大量、包括攝像頭傳在內的感器。如果我們把它用來篩查皮膚癌會怎麼樣?或者篩查其他疾病?」
Google利用深度學習診斷糖尿病視網膜病變糖尿病視網膜病變是目前越來越被人們重視的致盲病因,目前全球範圍內有 4.15 億糖尿病患者面臨視網膜病變的風險。若是發現及時,該病是可以被治癒的,但若是未能及時診斷,則可能導致不可逆轉的失明。
糖尿病視網膜病變患者視網膜基底造影示例。左側圖片采自眼部正常的糖尿病患者;右側圖片采自患有視網膜病變的糖尿病患者,圖中顯示出該病人眼底有出血現象
一般來說,醫生要通過糖尿病患者的眼底造影圖像來判斷是否視網膜發生了病變,並通過眼底病變來判斷嚴重程度,例如是否出現了微動脈瘤、眼底出血、硬性滲出等,主要參考出血、液體滲出等病況。這就對醫生個人水平提出了較高的要求,如果缺乏臨床經驗,那麼很容易誤診或漏診。
2016年,Google的研究者Varun Gulshan和他的同事利用深度學習創建了一種能夠檢測糖尿病視網膜病變和黃斑水腫的演算法,它能夠通過眼部掃描圖像判斷患者的視網膜是否發生了病變,輔助醫生在有限的醫療條件下進行診斷。該研究發表在2016年11月30日的《美國醫學會雜誌》期刊上。【2】
黑色曲線表示演算法性能,彩色點表示八位眼科專家對糖尿病視網膜病變(輕度或重度糖尿病視網膜病變,或由糖尿病引起的視網膜黃斑水腫)的臨床診斷結果。
為了訓練該演算法,研究者從EyePACs資料庫搜集了128 175例注釋圖片,每張圖片都記錄了 3-7 名眼科醫師的評估結果。與該團隊合作的眼科醫師一共 54 名。為了驗證演算法的準確度,研究者使用兩個獨立的數據集進行驗證,一個9963例圖像一個1748例圖像。與8名眼科醫生診斷結果對比,谷歌的這款演算法甚至超過人類醫師:演算法獲得0.95的F分數(結合敏感性和特異性指標,取max = 1),相比八位眼科專家的中位數 0.91分。
本次眼影所用的圖像為2D圖像,谷歌Deepmind已經開始將更為精確、全面的3D圖像技術(光學相干斷層掃描(OCT))應用於深度學習中。
中國科學家利用深度學習篩查先天性白內障先天性白內障是一種罕見病,集合了慢性和急性疾病的特點。它導致失明和視力損傷,多在出生前後即已存在,或在兒童期內罹患,在我國發病率為0.05%。
受到2015年谷歌DeepMind發表論文的啟發,中國中山大學中山眼科中心的80後眼科醫生林浩添和他的同事萌生出想要創建一個人工智慧平台來挖掘他們在先天性白內障的臨床數據,進而達到篩查和輔助診斷的目的。他們聯合西安電子科技大學劉西洋教授利用ILSVRC 2014(ImageNet Large Scale Visual Recognition Challenge of 2014)的冠軍模型來建立識別先天性白內障的深度學習模型(該模型被認為在圖像識別領域佔主導地位,可用於訓練和分類),取名為CC-Cruiser。本次研究成果於2017年1月30日發表在Nature Biomedical Engineering期刊上【3】。
訓練CC-Cruiser的圖片集,研究者採用了來自中國衛生部兒童白內障計劃(CCPMOH)例行檢查的一部分圖片,包括410幅不同嚴重程度的先天性白內障兒童患者的眼部圖像,476幅正常兒童眼睛圖像。所有圖片均由兩名有經驗的眼科醫師獨立地進行分類和描述,第三名眼科醫師對分歧案例提供諮詢。這三名人類醫師是沒有接觸過CC-Cruiser的。
圖為CC-Cruiser與人類醫師的比較測試
研究者對CC-Cruiser的性能進行了5次測試,結果都非常出色。在和人類眼科醫師的50例圖像比較測試中, CC-Cruiser找出了所有先天性白內障患者。而三名眼科醫師在第3例圖片上都犯了錯誤——誤將圖片的高光區域診斷為先天性白內障。在危險評估和輔助決策中,CC-Cruiser表現也不錯,對所有需要進行手術的患者都給予了正確的治療建議。因此,研究者認為CC-Cruiser可以稱得上是一個「合格的眼科醫生」。
Atrerys成為首個FDA批准的深度學習臨床應用平台4D心臟MRI
2017年,GE健康聯手舊金山初創公司Arterys顛覆現有的心血管磁共振成像(俗稱心臟MRI),將3D的MRI引入新的時間維度,使其MRI擴展為4D,不僅能夠全方位地展示心臟結構,還能夠顯示血液流動的速度、方向以及流量。
與此同時,Arterys還推出了基於雲計算和深度學習技術的Arterys Cardio DL應用,它是第一個獲得FDA批准的深度學習應用,此舉意味著深度學習和雲技術將進一步落地在日常醫療服務。
Arterys Cardio DL可用於治療多種心血管疾病,包括先天性心臟病、主動脈或心臟瓣膜疾病等。它能夠自動採集心室的內外輪廓的數據,並提供心室功能的準確計算,耗時短,精度高,一份圖像的分析10秒即可完成,遠遠快於臨床醫生。因此,稱之為基於深度學習的人工智慧醫學影像分析系統,它已經進行了數以千計的心臟案例的數據驗證,實驗證實,該演算法產生的結果與經驗豐富的臨床醫生的分析結果結果是不相上下的。
作為GE健康的合作夥伴,Arterys Cardio DL的功能將整合在GE推出創新成像技術ViosWorks,它可以從7個維度呈現心臟:包括3個空間維度,1個時間維度,3個速度維度。
誠然,深度學習能夠幫助醫生更加高效、準確的「看片子」,但目前深度學習在醫療影像領域也存在許多阻礙和缺陷。
首先,就是數據量的問題。訓練深度學習需要優質的數據和大量的數據,斯坦福大學的研究者開發的演算法之所以能夠如此準確地診斷皮膚癌,原因之一就在於他們使用的訓練數據集比此前公布的任何同類方法都要大100倍左右。林浩添和同事們因為所做的訓練圖集較小,有讀者質疑是否經過擬合才獲得如此高的準確率。在數據量的缺乏是阻礙深度學習發展的一大障礙,醫療數據被分割在不同的醫院、部門裡,難以發揮真正的力量。除此之外,數據的維度仍然是一大問題。目前,深度學習主要用於2D圖像、3D圖像、4D圖像難以應用。
其次,深度學習是一個「黑箱」,大多數研究者難以接觸到最底層的演算法結構,只是將數據餵給深度學習,不可能也沒必要解釋「深度學習」到底怎樣做出判斷的。因此,這個「黑箱」存在欺騙的問題,也就是說在輸入的數據中加入小小的改變,就很容易誤導深度學習。
在上圖中,所有左列的圖經過中間的變換成右列的圖。對我們人類來說,變換前後圖片幾乎沒有變化,判對左列圖片的深度學習模型卻將右列圖片都判錯了。這說明人類和深度學習模型之間的區別還有很多。
雖然目前深度學習仍處於「輔助診斷」的階段,真正的決定權仍然在醫生手中。但特斯拉的自動駕駛已出現致死事件,深度學習在醫療影像也難以達到100%的準確率。一旦醫生聽信了深度學習的建議,最終卻導致了誤診或漏診,真正應該負責的到底是醫生還是機器?深度學習給醫療領域帶來的,不僅是技術問題,還有人文關懷問題。醫生和患者之間的互動將是人類智慧的最後一個堡壘。
參考資料:
1.Andre Esteva, Brett Kuprel, Roberto A. Novoa, Justin Ko, Susan M. Swetter, Helen M. Blau & Sebastian Thrun. Dermatologist-level classification of skin cancer with deep neural networks. Nature[J] 542, 115–118 (02 February 2017) doi:10.1038/nature21056
2.VarunGulshan,LilyPeng,MarcCoram,MartinC.Stumpe,DerekWu,ArunachalamNarayanaswamy,SubhashiniVenugopalan,KasumiWidner,TomMadams,JorgeCuadros,RamasamyKim,RajivRaman,PhilipC.Nelson, JessicaL.Mega, DaleR.Webster. Development and Validation of a Deep Learning Algorithm for Detection of Diabetic Retinopathy in Retinal Fundus Photographs. JAMA. 2016;316(22):2402-2410. doi:10.1001/jama.2016.17216
3.Erping Long, Haotian Lin, Zhenzhen Liu,Xiaohang Wu, Liming Wang, Jiewei Jiang, Yingying An, Zhuoling Lin, Xiaoyan Li,Jingjing Chen, Jing Li, Qianzhong Cao, Dongni Wang, Xiyang Liu, Weirong Chen& Yizhi Liu.An artificial intelligence platform for the multihospitalcollaborative management of congenital cataracts. Nature Biomedical Engineering[J]doi:10.1038/s41551-016-0024
4.http://www.prnewswire.com/news-releases/arterys-receives-fda-clearance-for-the-first-zero-footprint-medical-imaging-analytics-cloud-software-with-deep-learning-for-cardiac-mri-300387880.html?tc=eml_cleartime#continue-jump
推薦閱讀:
※時來運轉、財運爆發、一定發大財?
※當我們相遇後,這友誼的火花無敵爆發了!
※最養眼的顧比爆發點
※中.國將爆發前所未有的「雪崩式」返貧!你信么?
※讓女人味爆發的12款春裝,時尚的女神都買了,你還等什麼~