人類醫生的終結者：深度學習醫療2016-17兩次大突破

06-05

【AI WORLD 2017世界人工智慧大會倒計時29天】大會早鳥票已經售罄，現正式進入全額票階段。還記得去年一票難求的AI WORLD 2016盛況嗎？今年，百度副總裁、AI技術平台體系總負責人王海峰、微軟全球資深副總裁，微軟亞洲互聯網工程院院長王永東等產業領袖已經確認出席大會並發表演講。谷歌、亞馬遜、BAT、訊飛、京東和華為等企業重量級嘉賓也已確認出席。

本屆大會特設智能醫療論壇，並邀請到來自谷歌、卡內基梅隆大學、康奈爾大學等多位相關領域的專家和創業者，就「醫療 AI 在哪些方面已經或即將超越人類醫生」、「獨立的AI醫療系統何時能夠出現」等問題進行展望、分享。智能醫療的真實發展現狀如何？技術瓶頸何在？未來最有潛力的應用是哪些？請來世界人工智慧大會智能醫療論壇尋求答案。

更多大會日程陸續揭曉中……

參加大會，請關注新智元微信公眾號或訪問活動行頁面：http://www.huodongxing.com/event/2405852054900?td=4231978320026了解更多

1新智元報道

作者：張易，胡祥傑

【新智元導讀】南澳大學醫學專家 Luke Oakden-Rayner發表了一系列博客文章，討論機器會不會在短時間內取代人類醫生，他總結出了醫療AI領域的 6 大特徵，同時列舉了他認為深度學習在AI領域的兩大里程碑式的研究：谷歌發表在美國醫學會雜誌（JAMA）關於糖尿病視網膜病變的研究和斯坦福大學的研究者在2017年發表在Nature雜誌上的研究「達到皮膚病學家水平對皮膚癌的分類」。從產業層面看，在普華永道剛剛發布的全球AI報告中，也表明醫療是最容易受到 AI 影響的行業。智能醫療是否已達到「超越人類水平」的臨界點？獨立的AI診療中心何時出現？請來世界人工智慧大會智能醫療論壇尋找答案。

南澳大學的放射科醫師、醫學專家，在阿德萊德大學與公共衛生學院攻讀醫學博士學位的 Luke Oakden-Rayner從今年5月開始就在追逐醫療AI領域的發展，他寫了一系列的博客來介紹這一領域的最新進展，目前更新到第三篇，其系列博客的名字就叫《人類醫學的終結 - 醫學AI研究最前沿》（The End of Human Doctors – The Bleeding Edge of Medical AI Research）。

他這一系列博客的文章將主要討論：機器會不會在短時間內取代人類醫生。

他說，這些文章將會深入到醫療自動化的最前沿研究中。此前許多關於醫療AI的文章中，我們簡單地假設深度學習可以將醫療的任務自動化，這麼做是有意義的，因為這樣我們就能獲得一大堆的概念和定義，但是，在這篇文章中，我們首先要對這一說法進行一下論證。

接下來，會討論醫療AI所面臨的阻礙，此前許多討論都集中在外部的障礙，比如監管和自動化的普及率。但是我們甚至都沒有觸碰到最本質的問題——技術上的挑戰，它可能會減緩AI對醫生的替代。

在前面的三篇文章中，他列舉了他認為深度學習在AI領域的兩大里程碑式的研究，分別標誌著這一領域所取得的第一和第二個大突破：谷歌發表在美國醫學會雜誌（JAMA）關於糖尿病視網膜病變的研究和斯坦福大學的研究者在2017年發表在Nature雜誌上的研究「達到皮膚病學家水平對皮膚癌的分類」。

此外，他還介紹了一些「小的但是不容忽視的」研究，比如「高解析度乳腺癌篩查與多視角深卷積神經網路」和「檢測巨細胞病變圖像上的癌症轉移」。

通過這些最前沿的研究，他總結出了醫療AI領域的6 大特徵（問題）：

醫學影像提出了大多數其他圖像分析AI不必面對的特定問題。其中之一就是「瓦力在哪裡」的問題：圖像通常是海量的，但疾病的特徵通常是小而微妙的。
在醫療任務中，通過丟棄像素來壓縮圖像可能會損害性能，這意味著預訓練不適用。
巨大的圖像帶來了技術上的挑戰，因為深度學習的硬體很難匹配其需求。
解決這些挑戰的一個方法是通過基於補丁的訓練，但是這會成倍地增加數據集收集的時間和成本。
臨床人群的低發病率意味著我們通常需要龐大的數據集才能找到足夠的陽性病例。就算這些數據集本身已經存在，這也會大大增加成本。
醫學AI系統在某些特定方面比人類專家更靈活，即使水平達不到人類的層次，但也可能是有用的。

以下是Luke Oakden-Rayner的博客文章內容，以第一人稱方式呈現：

醫學深度學習的第一個大突破

第一部分，我們將會對一個研究進行深度的解讀，這絕對是一項最先進（state of the art）的研究。

首先，我想提醒大家，從2012年開始，深度學習才成為一種可應用的方法被使用，所以，我們在醫學中使用這一技術的時間還不超過5年，並且，要知道，醫療人員在技術上的反應通常會慢半拍。有了這些前提，我們會發現現在取得的很多結果都是令人難以置信的，但是，我們也必須承認，這僅僅是開始。

接下來，我會對一些明顯代表作醫療領域自動化取得突破的論文進行解讀，同時會補充一些有用的對話。除了介紹論文，還會討論以下幾個關鍵要素：

任務：這是一個臨床的任務嗎？如果這一工作被自動化，有多少醫療從業者會被顛覆？為什麼這一任務會被選中。

數據：數據是如何收集和處理的?它如何遵守醫學審查和監管要求？我們可以更廣泛地了解醫療AI的數據需求。

結果：它們與人類醫生相比能力如何？它們究竟測試了什麼？我們還能收集更多的什麼?

結論：這一研究的重要性在哪？可擴展的地方在哪？

第一個論文。谷歌發表在美國醫學會雜誌（JAMA）關於糖尿病視網膜病變的論文。（2016年12月）

任務：糖尿病性視網膜病變是致盲的主要成因之一，主要由眼睛後部細小血管損傷引起。這是通過觀察眼睛的背面，可以看到血管。所以這是一個感知任務。他們訓練了一個深度學習系統，執行與糖尿病視網膜病變評估相關的幾項工作。文章標題中所提到的結果是評估「可參考」的糖尿病性視網膜病變，其正在檢測中度或更差的眼睛疾病（該組患者的治療方式與「不可參考」眼病患者的治療方式不同）。他們還評估了識別嚴重視網膜病變並檢測黃斑水腫的能力。

數據：他們對13萬個視網膜照片進行了訓練，每個級別由3到7名眼科醫生進行評估，最終的標籤以多數票決定。圖像來自使用各種相機的4個位置（美國EyePACS和3家印度醫院）的康復臨床數據集。

網路模型：他們使用了Google Inception-v3深層神經網路的預訓練版本，這是目前使用最好的圖像分析系統之一。預訓練通常意味著他們已經接受過訓練的網路來檢測非醫療物體（如貓和汽車的照片），然後進一步對特定醫學圖像進行了訓練。這就是為什麼網路只能接受229 x 299像素的圖像。

結果：這篇論文我認為是醫學深度學習的第一個大突破。他們的AI系統獲得了與單個眼科醫生相同水平的表現，在於眼科醫生的平均水平相比時，也不落下風。

圖：彩色的點是人類眼科醫生，黑線是谷歌的深度學習系統。

與人類以上相比，他們的系統在檢測黃斑水腫上做到了相同的水平，但是在更嚴重視網膜病變絕對值（AUC值）上要差一些。

關於這一研究的10點總結

Google（和合作者）訓練了一個系統，以檢測糖尿病視網膜病變（其導致全世界5％的失明），系統的表現與一組眼科醫生的表現相當。
這是一個有用的臨床任務，這可能不會節省大量資金，也不會在自動化的時候取代醫生，但具有很強的人道主義動機。
他們使用130,000個視網膜圖像進行訓練，比公開的數據集大1到2個數量級。
他們用更多陽性的案例豐富了他們的訓練集，大概是為了抵消訓練對不平衡數據的影響（一個沒有共識性的解決解決方案的問題）。
由於大多數深度學習模型都針對小型照片進行了優化，所以圖像被大量採樣，丟棄了90％以上的像素。目前看來，我們還不知道這是不是件好事。
他們使用一組眼科醫生來標註數據，很可能花費了數百萬美元。這是為了獲得比任何單個醫生的解釋更準確的「真正的真相」。
第5點和第6點是所有當前醫學深度學習系統的錯誤來源，而且人們對這些話題知之甚少。
深度學習系統比醫生有優勢，因為它們可以用於各種「操作點」。相同的系統可以執行高靈敏度篩選和高特異性診斷，而無需再訓練。所涉及的trade-off是透明的（不像醫生）。
這是一個很好的研究。它在可讀性上是令人難以置信的，並在文本和補充中包含了大量有用的信息。
該研究似乎符合目前FDA對510（k）法案的要求。雖然這項技術不太可能要通過這一手續，但是該系統或衍生物完全可能在未來一兩年內成為臨床實踐的一部分。

第二篇具有代表性的突破性研究是斯坦福大學的研究者在2017年發表在Nature雜誌上的研究「達到皮膚病學家水平對皮膚癌的分類」。

任務：皮膚科是主要專註於皮膚病變的醫學專業。他們處理皮膚癌（美國每年10,000人死於該病）和其他全身性疾病的腫瘤，皮疹和皮膚表現等系統疾病。作者訓練了深度學習系統，用於執行與皮膚科實踐相關的幾項工作。標題的結果是對「需要活檢」病變的評估，這是鑒定可能患有皮膚癌並需要進一步處理的患者。他們還評估了直接從圖像中識別癌症的能力，以及一項更複雜的任務，試圖診斷病變亞組。

數據：他們從18個不同的公共資料庫以及斯坦福醫院的私人數據中訓練了13萬個皮膚損傷照片。不幸的是，這篇文章並沒有說清楚數據來源及如何構建，所以我真的不知道訓練標籤是什麼。在論文中，他們將數據描述為「皮膚科醫生標註的」，但也提到了各種位置的活檢結果。我想我們可以假設，這個數據的大部分是被單個皮膚科醫生標記，沒有活檢結果。

網路模型：同第一個研究。

結果：本研究是我認為醫學深度學習的第二個重大突破。他們比大多數單個皮膚科醫生以及他們提供的比較的皮膚科醫生「平均」水平獲得了更好的表現。

關於這一研究的8點總結

1.斯坦福大學（以及合作者）訓練了一個系統來鑒別需要活檢的皮膚病變。皮膚癌是淺色皮膚人群中最常見的惡性腫瘤。

2. 這是一個有用的臨床任務，是目前皮膚科實踐的很大一部分。

3.他們使用13萬個皮膚病變照片進行訓練，並且用臨床上典型的陽性病例豐富了他們的訓練和測試組。

4.圖像被大量採樣，丟棄了大約90％的像素。

5.他們使用「樹實體論」組織訓練數據，通過培訓來提高其準確性，以識別757類疾病。這甚至在更高級別的任務上改進了結果，如「這種病變需要活檢嗎？

6.他們比單個皮膚科醫生能更好地識別需要活檢的病變，具有更多的真陽性和較少的假陽性。

7.雖然可能存在監管問題，但該團隊似乎已經有一個有用的智能手機應用程序。我希望在未來一兩年內可以為消費者提供這樣的東西。

8. 對皮膚病的影響尚不清楚。至少在短期內，我們實際上可以看到皮膚科醫生的需求不斷增加。

最後，Luke Oakden-Rayner總結說，我認為這些研究是突破性的，事實也說明了這個問題，兩個研究組似乎都在研究初次發表後六個月內臨床測試了這些系統。谷歌的視網膜病變研究實際上已經完成了初步的臨床試驗，並正在印度推出系統，旨在解決受過訓練的眼科醫生處理糖尿病眼病短缺的問題。斯坦福大學皮膚科組正在建立一個智能手機應用程序來檢測皮膚癌。

醫療是最容易受到AI影響的行業，獨立的AI診斷中心前景可期

普華永道剛剛發布了名為「探索 AI 革命」的全球AI報告，特別推出了「AI 影響指數」，對最容易受到 AI 影響的行業進行了排名。其中，醫療和汽車並列第一位。

AI影響評分從1-5（1是最低的影響，5最高），醫療和汽車都是3.7分，並列第一：

而實際上，從 2011 年開始，醫療領域一直高居 AI 行業應用前列。CB Insights 曾發布過 AI 應用的「行業熱圖」，可以直觀地看出智能醫療的火熱程度。

從全球範圍來看，IDC 在其《全球半年度認知/人工智慧支出指南》中將醫療人工智慧統列為2016年吸引最多投資的領域之一，並表示在未來五年內，包括醫療人工智慧診斷和治療系統的使用案例將獲得最大的發展。在五年期間，它預測醫療健康人工智慧投資的年複合增長率為69.3%。

國內，根據億歐智庫的相關研究數據，截止至2017年8月15日，國內醫療人工智慧公司累積融資額已超過 180 億人民幣，融資公司共 104 家。

說回到普華永道的最新報告。該報告以「基於數據的診斷支持」作為智能醫療的高潛力用例，認為「人工智慧最初可能被作為人類醫生的輔助來採納，而不是替代人類醫生。這將改善醫生的診斷，但此過程也為 AI 學習提供了有價值的見解，讓其可以不斷學習和改進。人類醫生和 AI 驅動的診斷之間的這種持續的相互作用將提高系統的準確性，並且隨著時間的推移，人類將有足夠的信心完全授權 AI 系統進行自主操作。」

實際上，這一美好前景已展現出了些許萌芽。如依靠計算機視覺的智能醫療影像識別，已經隨著深度學習等技術的使用，來到了「超越人類水平」的臨界點。同時，2017 年 8 月，國家衛計委在新聞發布會上也傳達出一個重要信息：將在已有的 5 類可獨立設置的醫療機構上，再增加 5 類獨立設置的醫療機構類別（包括病理診斷中心、康復醫療中心等等）。隨著支持社會辦醫的政策落實，醫療的「牌照」價值正在下降，未來很有可能出現獨立的 AI 診斷中心，直接為患者提供診斷服務。

智能醫療是否達到超越人類水平的臨界點？看大咖怎麼說

將於2017年11月8日在北京國家會議中心舉辦的AI WORLD 2017世界人工智慧大會特設智能醫療論壇，並邀請到來自谷歌、卡內基梅隆大學、康奈爾大學等多位相關領域的專家和創業者，就「醫療 AI 在哪些方面已經或即將超越人類醫生」、「獨立的AI醫療系統何時能夠出現」等問題進行展望、分享。智能醫療的真實發展現狀如何？技術瓶頸何在？未來最有潛力的應用是哪些？請來世界人工智慧大會智能醫療論壇尋求答案。

我們隆重為您介紹首批確認的智能醫療論壇演講嘉賓，他們是：谷歌資深科學家韓玫；美國卡內基梅隆大學計算機學院計算生物學副教授馬堅；大數醫達創始人、卡內基梅隆大學計算機學院暨機器人研究所博士鄧侃；康奈爾大學威爾醫學院助理教授王飛。

馬堅

美國卡內基梅隆大學計算機學院計算生物學副教授

馬堅， 2016 年1月起擔任卡內基梅隆大學計算機科學學院計算生物學副教授，他也是CMU機器學習系的教授。他曾就職於伊利諾伊大學香檳分校（助理教授（2009-2015），副教授（2015））。他的小組研究一直專註於演算法開發，以幫助更好了解人類基因組的基本功能和人類疾病如癌症的分子機制。

演講主題：精準基因組數據與智能醫療最新進展

演講概要：互聯網下半場，人工智慧正在加速數據系統的閉合。醫療和健康數據是其中最重要也是最難獲得和解析的一環。從可穿戴設備到IoT，到醫學圖像、醫療檔案和個人基因組信息，如何加速多模態高維數據的整合，推動產業發展，同時又促進個性化普惠醫療，提升民眾的健康管理，需要學界和業界的創新性合作。我從基因組數據的最新發展入手，介紹一下精準基因組和智能醫療的進展，並探討與整個互聯網產業創新性結合的可能性。

鄧侃

大數醫達創始人，美國卡內基梅隆大學計算機學院暨機器人研究所博士

鄧侃，上海交通大學本科及碩士，美國卡內基梅隆大學（CMU）計算機學院暨機器人研究所博士，專攻人工智慧及數據挖掘。歷任美國甲骨文公司（Oracle）主任系統架構師，美國泰為手機導航公司（Telenav）北京分公司總經理，百度高級總監並主管網頁搜索和知識圖譜。

2015年，鄧侃創建北京大數醫達科技有限公司，旨在將深度強化學習技術應用於醫療健康領域。大數醫達對幾億份三甲醫院病歷，進行結構化解析，構建海量訓練數據，並結合臨床指南，訓練醫療深度強化學習模型。用於實現面向患者的醫療諮詢服務，面向基層醫生的臨床導航服務，以及面向醫院和醫療保險的全流程精細化質量控制和成本控制服務。

演講主題：多模態智能疾病診斷系統的四大技術難點

演講概要：北京大數醫達科技有限公司實現了多模態智能疾病診斷系統，該系統把 CNN、RNN、Attention、GAN、RL、MCTR、Knowledge Graph 等多種前沿技術融為一體，構建醫學智能診斷新體系。本演講重點介紹該系統以下 4 個方面的技術難點。

1. 把多模態數據，都轉換成以醫療知識圖譜為軸心的語義向量，在同一個參照系下進行相互比較和交叉操作；

2. 在知識圖譜為軸心的語義向量空間中，融合多模態數據，並使用生成對抗模型提供可行又可靠的質量評估方案；

3. 用卷積神經網路技術，從病情描述中提煉病情特徵，用聚焦機制，從醫學知識圖譜中補充相應病理邏輯，優化疾病的診斷與驗證；

4. 用深度強化學習和蒙特卡洛搜索樹技術，給醫生推薦最佳後續化驗和檢查項目，補充病情描述，用最小的代價，找到診斷金指標，提高診斷精度。

王飛

康奈爾大學威爾醫學院助理教授，IBM沃森研究中心顧問

王飛，博士，康奈爾大學威爾醫學院助理教授，IBM沃森研究中心顧問，法國液空集團研究顧問。曾任職於康涅狄格大學以及IBM沃森研究中心。他於2008年在清華大學自動化系獲得博士學位，其博士學位論文「圖上的半監督學習演算法研究」獲得了2011年全國優秀博士論文獎。主要研究方向包括數據挖掘，機器學習技術在醫療信息學中的應用。王飛博士已經在相關方向的頂級國際會議和雜誌上發表了近190篇學術論文，引用超過5000次，H指數39。其（指導的學生）論文論文曾ICDM2016最佳論文提名，ICDM2015最佳學生論文，ICHI 2016最佳論文獎，ICDM 2010的最佳研究論文提名獎，SDM 2015與2011最佳研究論文候選以及AMIA 2014轉化生物信息學峰會的Marco Romani最佳論文候選。王博士還是Michael Fox基金會主辦的帕金森病亞型發現數據競賽的冠軍獲得者。王飛博士是2017年國際醫學信息學大會（MedInfo）的分領域主席（track chair），2015國際健康信息學大會（ICHI）的程序委員會主席。王博士同時還是AMIA知識發現與數據挖掘 (KDDM) 工作小組副主席。任雜誌Artificial Intelligence in Medicine的編委（Associate Editor），Journal of Health Informatics Research的編委，Smart Health的編委，Data Mining and Knowledge Discovery的執行編委（Action Editor），Pattern Recognition編委。已在美國申請相關專利40餘項，授權15項。

演講主題：人工智慧與智慧醫療——現狀、誤區、挑戰及發展方向

演講概要：人工智慧正在改變著這個世界。醫療健康，作為每個人生活中不可分割的一部分，也正在被人工智慧改變著。全球的IT巨頭，例如Google, Microsoft, IBM，以及國內的IT巨頭BAT，都在試圖用先進的人工智慧技術來提高醫療質量，讓每個人變得更加健康。本報告將對目前人工智慧技術在醫療中應用的現狀做以小結，指出這一領域的常見誤區及挑戰，進而展望未來的發展方向。

韓玫

谷歌資深科學家

韓玫，谷歌資深科學家。她已發表超過30篇有關視頻分析、視覺跟蹤、物體檢測、幾何建模、圖像處理、計算機視覺、多媒體處理以及計算機圖形學的會議論文。擁有20多項美國專利。加入谷歌之前，韓玫曾是美國NEC實驗室研究員。韓玫本科、碩士、博士畢業於清華大學計算機科學與技術專業，並於2001年獲得卡內基梅隆大學機器人學博士學位。曾擔任3DV 2016，CVPR 2017和ACM Multimedua 2017的會議組織主席。