專訪《細胞》封面作者張康:AI診斷眼病是這樣超越人類的
《細胞》封面北京時間2月23日凌晨,張康團隊及其合作者在頂級學術期刊《細胞》(Cell)發表封面文章「Identifying Medical Diagnoses and Treatable Diseases by Image-Based Deep Learning」。這項最新研究訓練了一個基於「遷移學習」的全新AI診斷工具,可通過視網膜OCT(光學相干斷層掃描)圖像篩查致盲性視網膜疾病,並能在30秒內決定患者是否需要治療,準確率可達95%以上。張康等人不僅試圖將眼科醫生從龐雜的看片工作中解放,他們還將目標定鎖定在全身各系統可以進行圖像檢測的其他多種疾病。在此番發表的論文中,研究人員就通過將這套AI系統切換到診斷兒童肺炎中來探索其適用性。結果證明,AI工具不光能鑒別肺炎和正常胸部X線平片,還能區分肺炎的病原體為細菌還是病毒,準確率可達90%以上。「未來我們將繼續增加這個系統能夠診斷的視網膜疾病,同時還將加入包括腫瘤等的其他系統的疾病。」張康表示。
加州大學聖地亞哥分校(UCSD)眼科教授張康舉一反三的「遷移學習」在醫學領域,人工智慧被認為在超越人類專家快速審閱大量醫學影像方面極具潛力。然而,人工智慧為醫學成像提供臨床決策的演算法在可靠性和可識讀性上仍存在挑戰。 張康等人在這項研究中,應用的演算法則是「遷移學習」(transfer learning algorithm)。論文中指出,目前傳統的人工智慧演算法耗時且昂貴,而「遷移學習」則被認為是一種高效的技術,尤其是面臨相對有限的訓練數據。所謂的「遷移學習」,就是把已訓練好的模型參數遷移到新的模型來幫助新模型訓練,也就是運用已有的知識來學習新的知識,找到已有知識和新知識之間的相似性。張康表示,「這實際上就相當於舉一反三。」張康進一步解釋,比如,已經學會下圍棋,就可以類比著來學習象棋;會打籃球,就可以類比著來學習排球;已經會中文,就可以類比著來學習英語、日語等等。如何合理地尋找不同模型之間的共性,進而利用這個橋樑來幫助學習新知識,就是「遷移學習」的核心。相較於其他大多數學習模型的「從零開始」,「遷移學習」先利用卷積神經網路(Convolutional Neural Network,CNN)學習已有的已經標記好的預訓練網路系統。
卷積神經網路以醫學圖像學習為例,該系統會識別預系統中圖像的特點,研究人員再繼續導入含有和第一層圖像相似參數和結構的網路系統,最終構建出終極層級。張康等人的系統中,第一級網路是視網膜OCT圖像,第二級網路系統使用第一級的圖像尋找相應的特點,通過前向傳播固定低層圖像中的權重,找到已經學習的可辨別的結構,再利用反向傳播的方法提取更高層的權重,在其中進行反覆的自我調整和反饋、傳遞,達到學習區分特定類型的圖像的目的。張康表示,「這個模型可以使用極少的訓練圖像,更快、更高效的辨認圖像的特定結構。」張康還提到,遷移學習能讓深度學習變得更加可靠,還能幫我們理解深度學習的模型。比如,我們能夠知曉哪部分特徵容易遷移,這些特徵所對應的是某個領域比較高層、抽象的一些結構型概念。把它們的細節區分開,就能讓我們對這個領域的知識表達形成一個更深的理解。「這樣一來,機器就可以像生物的神經系統一樣終身學習,不斷地對過去的知識進行總結、歸納,讓一個系統越學越快,而且在學習過程中還能發現如何學習。」張康認為,「遷移學習」在深度學習上面有極為廣闊的應用前景,在圖像數據資源有限的醫療領域,更高效、所需圖像數量更少的「遷移學習」,可以說是未來5年內AI發展的熱點以及深度學習成功應用的驅動力。致盲性眼病診斷超越人類專家張康等人將上述「遷移學習」 主要應用於診斷視網膜OCT圖像。視網膜OCT使用光來捕獲視網膜的高解析度體內光學橫截面,該截面可以形成活體視網膜組織的三維體積圖像。目前,該技術已經成為眼科中最普遍使用的診斷技術之一,每年有近3000萬次視網膜OCT圖像產生。論文中指出,目前OCT成像已經在全球範圍內成為醫生們診斷治療某些致盲性眼病(年齡相關性黃斑變性(AMD)和糖尿病性黃斑水腫)的一項標準技術。數據顯示,美國有將近1000萬人患有AMD,每年還有超過20萬人會出現病理性脈絡膜新生血管,它也能夠引發AMD。另外,近75萬名40歲以上的人患有糖尿病性黃斑水腫,這是一種能夠影響視力的糖尿病性視網膜病變。研究人員認為,由於人口老齡化和全球糖尿病的流行,上述疾病群體可能會隨著時間的推移進一步增加。幸運的是,目前抗血管內皮生長因子藥物在視網膜疾病治療方面還較為樂觀。這也就意味著,如果疾病能被快速準確地診斷出來對患者來說意義重大。為訓練「遷移學習」演算法,張康團隊首先獲取了超過207130張OCT的圖像。通過質量初篩後,選取了來自於4686名患者的108312張OCT,包括37206張患有脈絡膜新生血管、11349張患有糖尿病性黃斑水腫、8617張患有玻璃膜疣、51140為正常。經歷了大量迭代訓練後,這款遷移學習演算法的精準度最終達到峰值。隨後,研究人員用來自於633名患者共1000張OCT成像圖片(上述四類樣本每類250張)來測試這一演算法模型。張康對澎湃新聞表示,「我們的AI系統能鑒別脈絡膜新生血管、糖尿病黃斑水腫、玻璃膜疣以及正常視網膜的OCT圖像,準確率、敏感度、特異度均在95%以上。」除了用準確率、敏感度、特異度、ROC曲線等來評估其表現,研究團隊還將AI診斷結果和6位臨床經驗豐富的人類專家進行對比。張康認為,「對比得出AI診斷結果與人類相似,甚至準確率更高。」此外,張康表示,研究中還通過「遮擋測試」得出機器診斷的依據。
AI工具和6位專家診斷結果對比未來會加入腫瘤診斷正如張康此前提到的「舉一反三」,研究團隊並沒有將「遷移學習」演算法應用局限在眼科方面,他們首先在兒童肺炎診斷方面探索了這套AI系統的普適應。據世界衛生組織(WHO),肺炎一直是兒童死亡的主要原因。每年全球有200萬名5歲以下的兒童死於肺炎,這一數字甚至超過了艾滋病、瘧疾和麻疹死亡兒童人數的總和。目前,近95%的新增兒童肺炎案例發生在發展中國家,尤其是東南亞和非洲國家。而細菌和病毒是兒童肺炎的兩大主要罪魁禍首。但這兩種不同類型的肺炎要求的治療應對方式截然不同:細菌性肺炎需要立即用抗生素治療,病毒性肺炎則主要通過支持性護理來治療。正因如此,準確、及時地診斷兒童肺炎的類型至關重要。研究人員收集了5232張兒童胸部X光片,用於AI系統的訓練。其中,3883張和肺炎有關(2538張為細菌性肺炎,1345張為病毒性肺炎),其餘1349張為正常。類似的,研究人員隨後用來自624名患者的胸部X光片對這一模型進行了測試。張康表示,「對於肺炎圖像,我們的AI工具不光能鑒別肺炎和正常胸部X線平片,還能區分肺炎的病原體為細菌還是病毒,準確率可達90%以上。」當然,研究人員並沒有止步於兒童肺炎診斷。張康對澎湃新聞表示,「我們的AI系統對於全身各系統可以進行圖像檢測的疾病都具有適用性,而決定其能否擴展到其他疾病的關鍵因素是其對於診斷不同的疾病之間的切換的容易度。」但相比於其他研究,張康認為他們設計的AI系統切換容易度已經有所降低。「在其他的研究中,研究者需要根據不同的疾病設計相應的過濾器,而我們的演算法會根據輸入的學習圖像產生自己的過濾器。另外,我們的『遮擋測試』也能幫助理解我們的網路系統是如何作出疾病『判斷』的。」張康提到,在接下來的工作中,研究團隊將繼續增加這個系統能夠診斷的視網膜疾病,同時還將加入包括腫瘤等的其他系統的疾病。現階段AI作用是輔助醫生而非取代儘管這套AI系統對於眼病等診斷的準確率已經超越頂級的人類專家,但張康團隊設計的初衷仍然是讓其「輔助醫生」。張康表示,目前人工智慧在醫療領域的應用已非常豐富。包括就診前疾病的篩查、預防,就診中醫療圖像輔助診斷、檢驗結果分析、手術輔助,以及就診後的醫療隨訪、慢性病監測、康復協助、健康管理,甚至還能用於基礎科研輔助、藥物研發、基因篩選分析、醫療培訓等等,具有極為廣闊的發展空間和應用前景。但就人工智慧目前的水平而言,張康認為其最容易被取代的仍然還只是比較單一的、流水線作業式的工作。「要相信,現階段人工智慧的作用是輔助醫生而非取代醫生。」張康表示,正如人類的工業革命,即使機器終究取代人類的部分工作,發展機器終歸是輔助人類、推動人類社會進步里程碑式的進步。在張康的理解中,未來人工智慧將從病人的就醫指導、緊急或普通轉診、輔助診斷、個體化治療等方面,作為輔助臨床醫生的工具,最大化地利用有限的醫療資源,緩解就診壓力,讓病人能更好更及時地獲得有效治療。張康認為,隨著今後醫療資源的自由流動,醫院可能更需要人工智慧輔助診斷系統。人工智慧可以幫助患者更容易、更高效地獲得治療。而對於此番研究團隊開發的這套AI系統,張康希望,這項技術未來能應用到包括初級保健、社區醫療、家庭醫生、急診室等,形成大範圍的自動化分診系統。
推薦閱讀:
※29歲孕婦9年生6孩子,如今又懷孕,網友:生活成這樣還生
※這個軍閥老奸巨滑,姨太太接連出軌,他這樣送她們上路|淘民國
※健康丨孩子感冒防治別瞎吃藥,有效預防要這樣做!
※家裡戶型無玄關,要怎麼布置鞋櫃?這樣做輕鬆解決!
※原來小麗花也可以開得這樣漂亮