醫學影像+人工智慧,解決這六個問題就能成功

x

要說最近什麼最火,人工智慧絕對算得上一個,各大投資機構已經在提從互聯網+過渡到AI+了。而人工智慧領域之中,深度學習絕對算得上現在最火的網紅了。圍棋界的人機大戰,阿爾法狗戰勝李世石、柯潔,不僅僅顛覆了人們對人工智慧還很遙遠的錯誤認識,讓人們看到了人工智慧的巨大潛力,同時,也帶火了深度學習,讓深度學習從學術界走到了大眾面前。

深度學習,通俗地說就是一套建立深度神經網路進行機器學習的方法。利用人工神經網路進行機器學習並不是什麼新的概念,幾十年前已經有了,但是,也就最近幾年,深度學習將機器學習推上了一個新的高潮,這很有可能是數據和技術的積累,終於達到了一次技術突破,一個新的拐點來臨了。

當這種技術突破在各行各業得到充分應用之後,將會給人類社會帶來翻天覆地的變化。一場新的技術革命即將展開,人工智慧新的時代即將來到。

深度學習技術在圖像識別,語音識別等領域有巨大的優勢。比方說,在語言識別領域,深度學習已經被科大訊飛等商業公司大規模應用。深度學習在醫學影像處理領域必定會發揮巨大作用,甚至能夠完成以前做不到的事情。

  • 有需求嗎?

優質醫療資源不足是一個世界性難題。特朗普上台後天天批駁奧巴馬版本"醫改計劃",而他拿出來的方案也未必有效。中國的醫改也是困難重重,醫患關係劍拔弩張,去過醫院的人都知道,行醫難,就醫苦!每一個患者都怕碰到庸醫,都想找經驗豐富的醫生。而培養一個經驗豐富的優秀醫生,至少需要十幾年,甚至幾十年。而且,在中國,更加諷刺的是,大量醫學院的學生畢業後卻換了行業!優秀醫生不足的問題就更加嚴重了。現在,在醫院,基本上就靠醫生的無私付出,患者的默默忍受,艱難維持著。這個問題在現有條件下基本上是無解的!這個痛點之痛再怎麼強調都不為過,因而需求也極其強烈。

如果深度學習在醫學影像診斷領域達到經驗豐富的的臨床醫生的水平,這就為最終解決醫療資源不足的問題打開了一扇門。

  • 能實現嗎?

利用深度學習演算法實現的Alpha Go打敗了人類圍棋高手,讓我們看到了深度學習演算法的強大。深度學習不僅僅可以用來下圍棋。舉個例子,十年前用微軟的Speech SDK做語言識別項目,當時還僅僅是用來識別預先配置的語音命令, 要求很低了。為了提高識別率,科研人工就需要先閱讀大量材料進行語音訓練,然後在使用的過程中,盡量勻速地,保持相同的語調,相同的音量進行說話,即使如此,也不能保證識別出所有的語音命令。然而,老羅在鎚子手機的發布會使用訊飛語音輸入法,識別正確率竟然能達到98%以上。不需要用戶提前訓練,可以隨心所欲地說,不需要去刻意改變語調語速音量,即使你帶著一口濃郁的湖建口音也可以識別,這種技術的提升給人帶來的是一種震撼的效果。

在圖像識別領域,採用深度學習的演算法的人臉識別率達到99%以上,ImageNet的比賽中,深度學習演算法也很領先。這一切都表明深度學習演算法已經相當成熟,可以進行商業應用了。同時,業界巨頭開源了大量機器學習的工具包,比方說Google的TensorFlow, Facebook的TorchNet,微軟的CNTK等等,這些開源包大大降低了應用深度學習演算法的難度,創業小公司也可以利用這些開源包將深度學習應用到醫學影像診斷領域。另一方面,硬體廠商也沒有落下,NVIDIA 、 Intel 、高通等大廠都開始發力機器學習推出各種用於深度學習的GPU晶元, Google也推出了自己的TPU晶元利用專有硬體實現深度學習。這些硬體方面性能的提升會大大提高深度學習計算的速度,進一步推動深度學習的普及。

  • 優勢在哪?

其實,在醫學影像診斷領域,我們已經有了大量的計算機輔助診斷演算法合和應用,幫助醫生進行輔助診斷。比方說,乳腺CAD系統,肺結節檢測演算法,腫瘤分割演算法,肝臟分割演算法,大血管提取演算法等等。

深度學習演算法和這些已有演算法相比有什麼優勢呢?以前,我們需要邀請大量的醫學專家,針對每一種特定應用,去研究分析,然後總結出識別的大量的規則和方法,然後根據這些規則和方法,進行建模,擬合出一種數學的表達方法,也就是一種具體的演算法。由於對於不同的病例,不同腫瘤,不同的組織,我們都需要一個個去研究分析,這個工作量極其之大。為了提高準確率,我們也許需要同時考慮幾十個輸入參數,很多時候都超出人腦的處理範圍了。而且,這個演算法的最後效果同時受到醫學專家的配合程度以及演算法工程師的抽象能力的影響,也許花了幾年時間研究出的演算法也並不理想。

深度學習演算法也許能夠幫助我們擺脫這個困境。我們不再需要人工去研究規則,擬合演算法;我們只需要找到大量已經標記好的圖像數據,然後採用一定的方法訓練深度神經網路,讓深度學習幫我們進行特徵提取。深度學習的本質就是通過多層非線性變換,從大數據中自動學習特徵,從而替代手工設計,深層的結構使其具有極強的表達能力和學習能力,尤其擅長提取複雜的全局特徵和上下文信息。深度學習的這種優勢使得我們可以更好地實現上述的一些醫學影像輔助診斷功能,甚至能實現以前無法實現的演算法。

  • 多久實現?

深度學習如此厲害,那我們是不是能馬上用它來實現電腦的醫學影像診斷呢?人們往往高估短期的改變,低谷長期的變換。也許,這一天的到來並沒有那麼快。

深度學習技術還要多久才能在醫學影像領域得到廣泛的應用呢?預計大概至少還需要五年時間,我們才能看到廣大醫院大規模使用深度學習技術進行輔助的閱片我們需要時間來積累已經標記的數據,需要等待為深度學習定製的硬體的發展,需要等待學習演算法的進一步優化達到實際臨床可用的地步,需要與醫院的各種現有系統,流程,設備進行介面等等。

  • 難點在哪?

將深度學習應用於醫學影像診斷的前提是,我們需要海量的已經標記的分類影像數據。沒有大數據,一切都是空談。[所以影像智能診斷的基礎是數據,是影像數據的積累和格式化處理]。

隨著全院PACS的普及,基本上,每家醫院都有幾十T的歷史影像數據。而且,最近國家建立了很多區域影像平台,影像數據的積累會大大加速。拋開各種隱私和各種法規不談,通過匿名化後拿到海量的真實的醫學影像數據應該不是問題。下一步,難點就是如何對這些海量數據進行分類處理,如何進行標註等等。像醫眾影像依靠平台真實影像數據的基礎,首先攻克的就是這個難點。

深度學習演算法中,如何利用領域知識,進行網路結構層的設計,訓練方法優化等等也是一大難點。為了達到商業應用的要求,像AlphaGo, 科大訊飛做的類似,聯合其他的人工智慧,機器學習方法,提高演算法效率也是一大難點。

  • 有誰在做?

在美國,已經有大量的創業公司利用深度學習進行醫學影像分析和診斷,比較有名的有Enlitic, CureMetric, VoxelCloud等等。國內也有一些創業公司在進行這方面的嘗試,比如醫眾影像等。

  • 如何切入?

深度學習技術在醫學影像診斷領域有著廣泛的應用前景。那麼,切入點在哪?在哪些細分領域會首先被應用呢?

大家首先想到的就是肺結節檢測。現在有不少的創業公司(超過十家)在利用深度學習技術進行肺結節檢測。 LIDC(Lung Image Database Consortium)的官網上有大量的已經標記的肺結節數據可以用來訓練神經網路,幾千例已標記的的標準數據集是一個很好的開始。利用深度學習來實現肺結節檢測可行性也非常高,不少初創公司已經宣稱肺結節的漏檢率在3%以下。不過,在醫院進行推廣這種應用並不容易。即使漏檢率很低,如果有大量誤報存在的話,醫生手動去排除誤報結節點也會很麻煩,這樣並不能提高醫生效率,導致醫生不願意使用。醫生都很忙,如果新技術的推廣過程中需要新增流程,或者改變現有流程都會帶來巨大的阻力。

深度學習可能在乳腺腫瘤計算機輔助檢測領域也很有前景。乳腺腫瘤篩查在美國非常普及,而且Mamo CAD系統也被廣泛使用。美國有一個家叫做R2 Technology的公司專門做Mamo CAD系統的,並且通過了FDA認證。後來,被Hologic這家生產乳腺X光機設備的公司收購了,Mamo CAD系統也就直接集成到了設備工作站中了。很多美國醫院在乳腺腫瘤篩查過程中都會用到Mamo CAD系統,而且,DICOM協議中有一章專門講Mamo CAD Structure Report, 很多乳腺工作站或者PACS系統都支持在圖像上顯示乳腺CAD結構化報告的結果。因此深度學習在這個細分領域切入很容易被接受,並很容易集成到現有的醫生工作流程和系統之中。

另外,深度學習在放療領域也應該大有作為。在制定放療計劃的過程中,技師需要將相關的正常組織全部勾畫出來,這是一個極其費時費力的過程。有的醫院,為了防止技師佔用TPS系統,竟然安排技師晚上加班進行勾畫,對於頭頸部放療,一個病人可能需要花費一個多小時進行勾畫。如果採用深度學習演算法,幫助醫生自動勾畫正常組織,這將很大程度提高醫生製作放療計劃的效率,具有巨大的市場前景。

推薦閱讀:

如何把MRI弄壞?
選對論文,效率提升50% | 本周值得讀
一千萬打造CMEF最強豪氣展廳,四天展會聯影耗資巨大到底值不值
AI+醫學影像:第一步,電子膠片
醫學影像人工智慧(AI)-現在開始,一觸即達

TAG:人工智慧 | 醫學影像 | 谷歌Google |