醫療創新的迭代,和一家AI獨角獸深潛其中的決心與遠望 |對話

醫療創新的迭代,和一家AI獨角獸深潛其中的決心與遠望 |對話

來自專欄機器之能13 人贊了文章

在醫療領域,一定是以臨床實踐的結果來衡量一款 AI 產品是否優秀,是否能夠幫助到醫生,是否能夠幫助到患者,是否能夠幫助到醫療機構,而不只是看其中某一個方面的具體數字指標。

機器之能原創,撰文:劉燕。

技術實力該如何評估比較?

拆解來看,目光多半要聚焦在測試比賽、論文發布、行業案例到項目招投標 PK,但在演算法水平看起來越來越趨同的今天,小數點之後的識別率比拼,反而不在於技術本身。

這一點,依圖科技一直看在眼裡。「99% 識別率的演算法和 99.99% 的演算法,區別在於可解鎖的應用場景。」依圖科技創始人朱瓏曾撰文提到。

以計算機視覺入手拓展到自然語言處理的技術路線之外,依圖選擇著重突破兩大行業方向——安防和醫療健康。

兩年前,依圖科技成立了獨立子公司挺進醫療行業。

很顯然,整個就醫環節仍有很多待解的痛點,這給了市場足夠多的想像空間。新技術門口總是擠滿一波轟然而上的變革者,一邊是對變化的渴望,另一邊是難跨越的行業門檻,從在線醫療、移動醫療到數字健康,創新者的窘境反覆上演。

再一次迭代,醫療又成為 AI 行業的「興奮劑」。根據公開數據統計,近兩年時間至少已經有超百家 AI 醫療公司,而熱門應用醫學影像吸引其中半數企業,原因就在於放射學科掌握 80% 以上的醫療大數據,是疾病診斷的入口。

但還是那些老問題,一切最難點還要回到解決臨床科室面臨多學科數據的挑戰上。「而未來 AI 真正重要的應用場景也在臨床科室。」依圖醫療總裁倪浩說。

不難理解,醫療 AI 直面臨床實踐,所有的 AI 產品最終都要接受臨床的考驗。

在大家都還在談演算法的時候,這家 AI 公司要到醫療行業深處,研究行業和數據標準的問題。

演算法是基礎,不能忽視,但「翻譯問題」的能力很重要——

如何理解醫生的臨床痛點,把醫生的需求翻譯成計算機領域的需求?

如何在演算法的基礎上搭建具體產品?

如何根據臨床醫生的反饋不斷調整演算法?

「很多因素都會影響產品的最終表現,尤其是在醫療領域,一定要以臨床實踐的結果來衡量一款 AI 產品是否優秀,是否能夠幫助到醫生,是否能夠幫助到患者,是否能夠幫助到醫療機構,而不只是看其中某一個方面的具體數字指標。」

為了避免訓練用的數據集、標註人員和方法的差異帶來的波動,依圖醫療選擇不再特彆強調敏感性、特異性等標準,而是瞄向醫生對 AI 產品生成的結構化報告的採納率。

這既是一個最直觀的效果對比,也更貼近醫療行業規則——只有醫生認可你的報告,才有價值。根據倪浩的說法,從依圖肺癌影像智能診斷系統部署到近百家三甲醫院的臨床實踐應用中看,結構化報告的直接採納率是 92%。

6 月中旬,依圖和四川大學華西醫院推出首個基於多維臨床數據智能治理的醫療大數據 AI 應用——肺癌臨床科研智能病種庫,以及全球首個肺癌多學科智能診斷系統。

在中國衛生信息與健康醫療大數據學會會長金小桃看來,「這是 AI 醫療從科研走向臨床的標誌」,而對依圖醫療而言,這是撬動行業的支點。

當我們提問依圖是一家典型的 AI 技術公司嗎?

倪浩堅定說:「依圖醫療其實不是一家 AI 公司,而是醫療公司。我們目前在做的也不只是單純的某一點的技術研發,而是希望將人工智慧技術與臨床實踐深度融合,將臨床專家的診療經驗融入 AI 產品,打造具備臨床價值的『MDT 醫生』,這是一個很難很難的過程,也需要相當長的一段時間。」

以下為機器之能對依圖醫療總裁倪浩的專訪,做了不改變原意的編輯:

當時我們在醫療領域的專業程度相比今天是天差地遠,只想到要專註於做產品,但沒有想到產品之外的一些事情。

2016年,也就是公司創辦四年後,依圖成立了醫療子公司,這個決定背後有哪些思考和目標?

有點機緣巧合。我大學是先學醫後學計算機,從阿里出來之後就打算創業,只不過當時想去做 C 端的移動醫療。

2016 年是一個比較好的年份,那時候深度學習在安防領域不管技術還是商業模式都被驗證了。從個人興趣和醫療領域問題的嚴峻程度來看,我認為醫療方向存在的不是「癢點」而是明確的「痛點」,所以我們當時就在想要去做醫療的人工智慧。

當時這個領域裡也沒什麼玩家,大家對這個領域都還處於比較懵懂的狀態,所以做市場的第一個進入者挺好的,尤其是針對這些明確的痛點,人工智慧技術也能夠發揮比較大的價值空間。

我們剛開始想做的那件事和現在的方向,幾乎沒有變化,我們一開始想的是拿頂級醫院優質數據跟頂級醫生合作,做高質量的演算法模型,再把模型帶到基層醫院去,給到基層醫生,賦能基層,就這個思路,我覺得到今天也沒變。

我們看到很多創業公司專註在 AI 醫療,或是一個計算機視覺公司把技術應用到包括醫療在內的領域,但單獨成立一個子公司的不算特別多,對嗎?

對,現在有幾類玩家。BAT 這一類,主要是在做投資收購或是成立部門做。其實在創業公司里做醫療方向的,基本上確實沒有像我們這樣花這麼大力氣去做的。

一開始你們就成立子公司,這個決定挺有意思。

這是因為當時認識到安防跟醫療是完全不同的兩個領域,它們之間的領域知識是有一些可借鑒性,也都算是比較專業的 to B 的領域,但行業差異巨大。我們當時的考慮是,從公司的專業度來看,需要由一家獨立公司去運作。

所以依圖不是要做一個典型意義上的 AI 技術公司?

我們認為,依圖醫療其實不是一家 AI 公司,而是醫療公司。依圖醫療在做的也不僅僅是做一系列的 AI 產品,更是要基於 AI 產品矩陣,提升醫療體系的運行效率及診療規範性,同時把頂級診療機構的診療能力賦能到基層,提升基層醫療機構的診療能力,緩解當前中國最為急需解決的優質醫療資源短缺及分布不均的問題,讓更多基層百姓享受到技術進步帶來的診療體驗提升。

我們目前在做的也不只是單純的某一點的技術研發,比如影像判讀,或者自然語言處理,而是希望將人工智慧技術與臨床實踐深度融合,將臨床專家的診療經驗融入 AI 產品,打造具備臨床價值的「MDT 醫生」,這是一個很難很難的過程,也需要相當長的一段時間。

明確成立醫療公司之後,你做出最重要的決定是什麼?為什麼那樣做?

一個非常重大的決定是將這家公司開在杭州。由於過往工作的關係,我當時對杭州這個城市的認知比較深入,比較而言,杭州是一個創新氛圍比較強的城市。

拿醫院舉例,杭州有兩家醫院在全國排到前 20 名,不過優質醫院資源整體上還是不如上海等准一線城市,但是他們對新技術、新事物的開放程度,可能是不少外地大醫院的專家們所不及的。這是我們這類創新創業公司非常需要的土壤和環境,到現在看,也仍然是很重要的決定,這使我們不少工作能以一個比較快的速度推進下去。

剛開始開展醫療業務時,有哪些挑戰、如何解決的?

剛開始其實我們把困難分成兩種,一種叫想像中的困難,第二種叫事實中碰到的困難。

想像中的困難是當時我們也會想醫院為什麼要跟我們合作?你又要拿數據,還要他花時間在這件事情上,然後我還什麼都給不了他,比如知識產權。但在實際接觸中,想像的困難倒不是困難,這跟當時的決定把公司開在杭州很有關係。

比如,我們起步的時候就敲定了和浙江省人民醫院放射科主任龔向陽教授的合作,他確實看到了他所在醫院、下級醫院的痛點,他覺得這個方向的創新性很好,所以抱著很開放的心態跟我們合作了。所以,想像中的困難一開始沒有成為真正的難題。

沒有想像過的困難,但在現實中碰到的困難的地方是,當時我們在醫療領域的專業程度相比今天是天差地遠,只想到要專註於做產品,但沒有想到產品之外的一些事情,比如產品上市前還有 CFDA 報批流程。

AI 類醫療產品的報批上市,進度情況是怎樣的?以前藥品最慢,醫療器械會好一點,這種政策方面的門檻會對依圖等公司產生多大的挑戰?

報批速度有提升。不過,AI 醫療類產品中,中國還沒有發出一張證來,就是還沒有任何一個公司拿到證,但是國家的支持力度蠻大。美國 FDA 已經批了兩款產品,雖然是小產品,就是不是像肺癌那麼大的一個產品,但已經報批了,所以我認為國內也會加速。

AI 產品落地臨床首先必須要懂臨床路徑,符合臨床使用場景;其次,產品要能夠和醫生的工作流密切結合;然後有很好的人機交互方式。

你們的第一個客戶是誰?是訂單層面的合作還是開發了自己的解決方案或產品銷售出去?

那個時候什麼都沒有,團隊也只有我跟鄭永升兩個人。我們去醫院待了挺長時間,看醫生怎麼讀片子,還拍了一些現場觀摩視頻,然後再去反覆研究這些視頻,針對專業流程去琢磨用技術怎麼去解決其中的問題。也就是,從臨床中去看實際痛點,然後再來設計產品,而不是先有產品的。

我們快速學了很多這個領域的專業知識,我制定的目標就是跟客戶交流的時候,不讓他們覺得我們外行,你要會行話,你得能跟上他們的認知。另一方面,我們比較強的技術功底以及信守承諾的做事方式,也打下了之後快速拓展業務的基礎。

現場觀摩或者說去弄懂行業規則的過程持續了多長時間?

我們 7 月份成立,9 月開始動手開發放射影像產品。其實我們中間也做過一些調整,我們做事情要想的比較清楚一點,不需要百分百清楚,但是得弄懂六七成,然後開始就要積極試錯。

這個項目的完成是公司產品化的一個重要節點嗎?

其實現在還不能說完成,只說階段性的成果已經達到了商業化程度。一個非常重要的時間節點在 2017 年的 2 月。

我們在 2016 年 9 月底 10 月初開始開發產品,到 12 月份一些種子醫院開始試用,然後到第二年也就是 2017 年 2 月,效果就出來了,但這只是第一階段做病灶的檢出,也就是計算機來找病灶這件事情。那時候央視聽說我們做的這件事,而且是發現科室使用效果比較好以後決定去採訪,這是當時一個標誌性的事件,我們把這段時間叫第一代肺癌診斷。後面我們的第二代又引入了隨訪,歷史影像對比等功能,到第三代就開始引入良惡性判斷。

從拿訂單到真正可以向行業提供可實施的解決方案,中間有哪些門檻需要邁過去?

想要讓 AI 產品落地臨床,並不僅僅只是技術過關這麼簡單,依圖的演算法一直都是世界級的,在全球最權威的人臉識別演算法測試 FRVT 中已經連續 2 年奪冠。

AI 產品落地臨床首先必須要懂得臨床路徑,符合臨床使用場景;其次,產品要能夠和醫生的工作流密切結合;然後有很好的人機交互方式,敏感性、特異性等基礎指標必須過關,能夠解決醫療機構遇到的某些問題。

在業務方向上,依圖醫療是選擇了不同的疾病方向一個一個去突破嗎?

我們明確在腫瘤、心腦血管和兒科這三個方向。我們選擇事情的邏輯就是:

第一要有可做的事情,這個階段太早期了,做的事情要看性價比,也就是做這件事情之後是不是能讓更多人受益,對公司來說也意味著市場越大,第二是對臨床醫生有真正的價值。

這兩點非常關鍵。所以我們做腫瘤的原因很簡單,就是因為現在像肺癌、乳腺癌、結直腸癌等疾病國家都在鼓勵早期篩查,早篩查意味著它進入到體檢體系里了,這個量就會比門診大很多。心腦血管一直是在國家醫保範圍內,基本上是醫保負擔裡面最沉重的一塊。兒科的痛點很明顯,兒科醫生缺口又非常大,加上我自己也剛有了小孩,有非常切身的體會。

具體的典型痛點是什麼?

其實產品思路都是從一線醫生日常工作中來的,針對他們做設計。因為說白了,主任不會去看簡單的常規性片子。印象比較深刻的細節是,一個試用我們產品的醫生說,以前他一瓶眼藥水幾天就用完了,因為老是對著電腦看片子,眼睛乾澀,一天看片子要持續到晚上 8 點左右。

我們這套系統用起來之後,他說他的眼藥水能用挺長時間,並且基本上在下午 4 點鐘能看完了。這是他們對於變化的直觀感受,這種來自醫生的反饋對我和我們團隊的正輸入,也就是激勵作用還是蠻大的,可能比多了十家醫院用我們產品更打動人。

醫療行業對 AI 技術的認識是什麼?這些年有哪些明顯變化嗎?

這個過程確實是漸進的,反正一個新事情出來的時候,一般可能只有 10% 的人會投入進去,可能 80% 的人觀望,還有 10% 的人是非常激烈地反對。今天這個比例已經變得非常明顯了,就是現在我覺得至少有 50% 的人是很支持它,也許那 10% 反對的人還沒變,但是支持的人已經變得非常多了。不管是放射科的大佬還是全國醫療行業各個領域的意見領袖,他們現在在各個公開場合幾乎都不談別的,只談 AI。

但也不得不說,現在有個現象是,一些比較急功近利的 AI 創業公司,為了讓宣傳數字好看把敏感性設置得很高,造成假陽性增多,反而成為醫生工作的負擔。

為了保證病灶不漏掉,比如說原來這個片子只有 2 個病灶,為了不漏掉,他找出 22 個,其中 20 個是假陽性,這會讓醫生的負擔加重,也就是說,醫生要把這 20 個都看一遍,把那些假病灶去掉,只留下 2 個,這就是一種負擔。

對我們來說,我們還是希望讓醫生真正從技術創新的產品中受益,所以我們專門做了一些降低假陽性的模型,我們在肺癌篩查裡面有十幾個模型,這是其中之一。這可以讓醫生不用做更多工作,直接採納我們的結果。所以,我們講的數字是超過 90% 的片子不再需要醫生改動,也就是可採納片子結果的比例,我們認為,這是對醫生臨床工作比較直接的幫助。

這個比例具體是多少?

這個數字一直有提升,現在是在 92% 左右。

老談演算法就是外行,內行都得看數據,這裡面一個核心問題是,演算法跟數據都很重要,但數據今天可能是更能建立壁壘的事情。

以肺結節檢測為例,醫院不同部門想要的結果應該是不同的,作為公司來說,對實現產品有什麼具體要求?

你說的很對,我們以前的產品是做給放射科的醫生用,然後他們的工作其實是只寫我看見了什麼,不做判斷。到呼吸內科時,或是到腫瘤科的時候,他最關注的不是我看見了什麼,而是這是個什麼東西?這在醫學上我們叫鑒別診斷。

在臨床科室,他們就開始關注鑒別診斷,比如這東西良性還是惡性的,它長的位置,侵犯的程度是什麼,這時候醫生看片的目的是為了評估比如說能不能手術,然後體積多大,適不適合使用放療,或者是什麼方案。

所以我們的產品做了第一代、第二代時,主要都是為放射科醫生做的,第一代做到找出來,第二代可以讓他們去對比。到第三代,我們就發現放射科做不下去了,因為他不關注再下一步的事情,然後我們開始對產品迭代方向進行討論,就是產品做到這裡就結束還是怎麼樣。

後來,我們對電子病歷有比較強的處理能力,發現臨床科室的醫生對影像的關注點跟放射科非常不一樣。但臨床科室的醫生又要基於多個學科的數據做判斷,需要影像的、電子病歷的、檢驗的數據,甚至還有基因數據。我們就開始把面向放射科的產品變成一個面向臨床科室的產品。

我們這個月發布的第二個產品就是叫肺癌綜合診斷。綜合診斷就是面向臨床科室的醫生,用多學科數據去做出綜合診斷。

用這套方案生成一個醫生可以直接採納的影像診斷結果的過程,是怎麼樣的?

這裡面有兩個關鍵,一個是演算法,一個是數據。我以前調侃過,老談演算法就是外行,內行都得看數據,這裡面一個核心問題是,演算法跟數據都很重要,但數據今天可能是更能建立壁壘的事情。

這個過程大致就是,我們先從醫院裡拿一批脫敏的片子過來,然後讓醫生去幫我們做標註。但不同的任務標註的東西也不一樣,比如說找病灶,有的任務是標註它的狀態,比如說它實性結節?還是毛玻璃?還是亞實性的?

有的標註是它有什麼徵象?比如說毛刺征、分葉征、空泡征這樣的東西,還有的是良惡性,但是良惡性醫生很難標註,我們一般是用病理的數據作為金標準,就是它有很多不同的模型來標註數據。

我們在影像方向性的演算法是 CNN 為基礎,用演算法先去確定出一個模型,這個模型有診斷能力,但這時候它的準確度是不夠的。你得再拿一批標得更精細的測試數據過來,根據測試集去評估演算法的表現,找到它的薄弱點。比如它在有毛玻璃的病灶表現不夠好,就在訓練模型裡面去加大毛玻璃這種病灶的比例,這是一個演算法優化的過程。

這裡面涉及到神經網路的一些參數的調整,一直在迭代,一直迭代到一個你比較滿意的模型。所謂的「比較滿意」,以我們現在的標準是比醫生的平均水平再高出五個百分點,我們覺得是可以先拿到醫院去測試,去試用。

試用完成了之後,醫生又會給出很多反饋回來。我們在醫院的系統自帶有讓醫生非常方便給出反饋交互的按鈕,把他的反饋再拿回來,再去優化演算法模型,基本上是這麼一個過程。但是這裡面標註是非常複雜的,標註的複雜程度怎麼講?

比如說,一個比較好的肺結節模型的經驗數據至少是 30 萬以上的數據集,30 萬以上的數據集才會有一個好的表現的結果。但問題是你讓人去標 30 萬個片子是很可怕的一件事情。

這套標註方式效率很高。

對,所以我們的標註體系叫人機協同,多級標註決策,也就是我們在標 5000 個數據的同時會訓練出一個模型,這個模型來幫助醫生提升標註效率。這樣一來,醫生還可以基於機器的標註結果進行修正,對他來說,標註的工作量會減少很多。

我們對標註過程做了很多優化,標註團隊負責人是一個心理學博士,他會研究比如說醫生標註一致性差異的根源是怎樣的,從心理學角度去研究它的差異,他們很有希望發出一份非常牛的論文。

我覺得數據處理能力是一個非常核心的競爭力。在標註之前還有一個叫做問題定義的過程,非常考驗產品和技術人員功底,就是怎麼把一個醫學問題翻譯成一個計算機問題,這個是標註團隊最核心的價值。

我們也走過彎路,之前做這部分的人主要是計算機背景出身,我們發現其實做不好,後來把人變成了醫生加計算機的人一起去做,而且你得找這裡面有跨界思維的人。我認為,這類人是人工智慧領域最稀缺的人才,稀缺程度甚至超過演算法工程師。

剛剛說了兩個問題,一個是數據標註,總結起來就是數據問題,還有一個是前期演算法構建問題,所以它們是計算機視覺技術應用到醫療行業的兩個痛點、也是與自動駕駛、安防這些領域具有不同挑戰的地方,對嗎?

對,它的門檻在於標註不是普通人能做的。安防的人臉標註基本上誰都能做,但到醫學這個領域,你必須得找被訓練過七八年的專業人士才能做,所以這個門檻就大大提高了。

醫療行業這些特有屬性會要求咱們在模型設計上有什麼講究嗎?或者依圖有什麼跟其他公司不太一樣的地方?

其實演算法的核心競爭力依圖一直積累得比較強,但在醫療領域很大的一個不同點在於:拿安防領域舉例,一個人臉找出來了,大家就會說識別很好很準確;在醫療領域你找出來了,然後你也準確判斷了良惡性,但醫生不買賬,為什麼?

無論醫生還是患者,他們還需要一個解釋,用醫學的方式解釋為什麼是這個結果,但深度學習本身就是不可解釋。所以,後來我們做了非常多的事情去解決這個問題。我覺得想變革一個行業,你得先搞懂這個行業的核心訴求,你得先讓核心人群比如醫生認可,然後在他們熟悉使用、習以為常之後,這件事情(可解釋性)可能才會變得不重要。

我們的肺癌篩查產品裡面有十幾個模型,其中好幾個模型是為了可解釋性做的,比如說,它是良性還是惡性?並且會從醫學權威指南角度來說,它有沒有毛刺、倍增時間多少等?為什麼會認為是良性還是惡性?

我們做一個模型專門去看,把可解釋性做出來。從這個角度上,可以把可解釋性作為它設計的一部分,這也是我認為我們跟其他廠商拉開比較大差距的部分。

所以越過這個門檻,在開拓市場這個層面也會比較好做一點。

對,反正 PK 我們從來沒輸過。當然現在我也不覺得有什麼太重量級的對手。

因為人口基數大,醫療數據應該是非常豐富的,但電子病歷普及很晚也很慢,各個醫院之間也不統一,這對醫療 AI 的創新是難題嗎?依圖怎麼解決?

有,一直存在。我們這次產品發布會上邀請到了金小桃(現任中國衛生信息與健康醫療大數據學會會長、北京大學健康醫療大數據國家研究院院長),他以前是國家衛計委副主任,他一直在主導打破信息孤島這件事情。

我們只關注數據裡面的那些特徵,並不關注數據本身。對我們從業者來說,我覺得這也是要點之一,你需要做一個有效的數據平台,因為一個產品做出來很可能有地域性的特徵。

比如說,我們做的骨齡檢測評估小孩子生長發育的情況,地域性特徵就非常明顯,東北人跟廣東人的發育速度完全不一樣。如果你只覆蓋到某一個地方的數據,產品肯定是不行的。所以你一定要有足夠的泛化性,你就要有多大的數據量。但是現在這個狀態下只能靠自己做。這同樣是壁壘之一。

但問題是依圖去做,相當於這些數據其實也是依圖來推動的,然後 B 公司 C 公司也這麼做,數據也還是各家擁有並掌控在自己手上,最後還是要形成另一種層面上的信息孤島。

對,這件事肯定是一個重複建設的過程。但是這個事情其實也只能依賴於國家,因為我以前在互聯網金融行業也看過,就像他們一樣,每家做互聯網金融的公司都面臨共同的問題,就是有一幫欺詐的人來騙貸款,這家騙完了去騙那家。這是他們的常用的手段,這些公司也覺得我們能不能共建一個徵信庫?但實際上是很難做出來的,大家這種競合關係是非常微妙的。

所以其實你也很難看到,哪個行業真正把數據共享打通,大家都能用。再換個角度說,如果數據共享都打通了,可能這個行業的壁壘也就不那麼高了。

醫院採購的影像設備是不同品牌或型號,這意味著數據源會有差異,這種情況會對模型精度造成影響嗎?需要根據特定設備類型調節模型嗎?如何控制數據質量?

在 CT 領域,CT 本身的影像差異性不是那麼大。基本上,進口、國產設備都可以用我們的產品。但是在 MR 領域,差異性相對比較明顯。所以,這跟我們涉足的領域有關係。

做 MR 領域,需要對產品設計有不同要求,你的成本會更高,然後數據又被分散了,需要根據特定的設備類型去做一些調解。

我們布局是從頂級的醫院,然後延展到基本上所有的醫院,最後到達 C 端。

如果從痛點上講,醫療領域可以做的事情非常多。目前,我們看到依圖合作的醫院非常多,共建了醫學影像中心,也有看到肺癌篩查、骨齡判斷等產品,那麼從整個產品解決方案的體系框架上我們的打法是什麼?

說起來就稍微有點複雜。我們有三條產品線,第一條產品線是以為頂級醫院設計為核心的,比如跟華西依圖聯合研發的肺癌臨床科研智能病種庫,核心問題是解決醫療數據可以被挖掘、被洞察的問題,它的主要客戶群體是頂級專家和頂級醫院。我們為什麼做這個東西?因為把這些醫療數據結構化、標準化是一個基礎。

現在發現,我們應該把這個東西做成一個產品,然後給醫生拿去做醫學科研,我們本來也是基於這些資料庫去開發新產品。從業務上面來講,這次華西醫院採用了我們的單病種資料庫的平台,它基本上也會跟我們一起去合作開發產品。

第二類產品是打通大醫院到基層醫院,我們開發可以服務於基層醫院的功能或產品,比如肺癌診斷、乳腺癌診斷、骨齡生長發育等。

第三類產品線是決策支持類,它有一部分是可以轉化到 C 端,推動 C 端跟 B 端的打通,主打做一些臨床路徑優化。我們不會直接將一個診斷結論給患者,肯定還是給醫生,因為我們定位是醫生的支持,但可以做到利用人工智慧讓患者更好地跟醫生溝通。

所以我們布局是從頂級的醫院,然後延展到基本上所有的醫院,最後到達 C 端。

你們把資料庫的產品當作一個打通醫療服務的入口,對嗎?看中這類產品在醫療行業的可延展性。

是這樣。

其中的技術門檻都有哪些?

最大的技術門檻包含幾部分。在建資料庫時,它用到的技術是多個領域的,至少是自然語言處理再加上圖像領域,但圖像領域說起來簡單,它也包含了放射影像、超聲影像或者病理等數據,還有第三類像血液檢驗或是尿檢等結構化比較好的數據,以及第四類基因之類的數據。所以,對技術公司的基礎能力非常有考驗,這也是為什麼到現在只有我們做出這個病種庫。

以前沒有自然語言的技術,但是因為醫療開始做自然語言這件事情是在 2016 年,自然語言這裡面的技術難度比影像要高很多,自然語言是人類的抽象語言,而影像是非常客觀的數據。

比如說每個醫生的描述都不一樣,每個醫生的說法都不一樣,但是他們可能在講的是完全一樣的事情,你得對這堆文字信息全部都提取出來,變成一個結構化的信息。大家的說法不一樣,你要把它一致化,比如有的醫生說肝硬化,有的醫生會說肝硬變,我們在日常交流時會意識到這是同一種疾病。

但在機器化的過程中,我們只有把它們變成同一件事之後,資料庫才能形成,而且還要讓各個學科的數據融合起來,比如要把患者病史、家族史,和他的血液檢查指標、病情發展過程等,這又涉及到多個學科數據融合的問題。這裡面有很多看不見的技術挑戰。

剛才也提到依圖會去提高自然語言處理方面的能力,具體做了哪些努力?

在早期,深度學習演算法對影像和語音技術的提升非常高。比如,應用在語音識別和影像人臉識別或者是圖像分類,百分比提升非常可觀。但在自然語言領域,一直沒有非常大的突破。

我們基本上沒有什麼可參考的,自己在做一些原創性的基礎科學研究。這裡面門檻很高,比如,業內有一些做科研資料庫的公司,他們都是用人工的方式,或者用一些規則匹配的方式,但效果非常差,大概不到 30% 的數據能被自動提取出來,還有一大堆都要靠人手工做。

我們現在能做到幾乎是 99% 以上。這裡面有一個非常強的技術創新,當然我們也考慮了領域相關性。在醫療行業,電子病歷有它自有特徵,我們現在做的事情還不能分發到所有行業,只在醫療行業非常適用。

這個部分的投入是怎麼樣的?

我們自己的說法叫有多少人都沒用,就是取決於你最強的那個人有多強,人數不是很多,但這是一組最強的團隊在做。

最強的團隊怎麼強大?

取決於一個人的眼界,最強的那個人的眼界有多寬,要解決醫療的行業問題,他不能只從演算法的角度去想辦法,他得理解醫療領域的數據特點,還有醫療領域其他可利用的設施,比如醫學術語庫等。這個人得有一個解決問題的綜合思維,因為這不是一個重算演算法的事情。

依圖建立了很大的醫生團隊,為什麼這麼做?他們在公司做哪些工作,對依圖的產品或其他哪些方面起到什麼作用?

是的。我們的醫生力量主要分成兩部分,第一部分是三十多人的全職醫生團隊,他們基本都當過醫生,有些是直接從醫院挖過來的,有的是以前在醫院後來去藥廠研究部之類的。他們在依圖最重要的工作是做醫學問題的定義,推動醫學向計算機轉化的這個過程。

第二部分就是我們的兼職醫學標註團隊,現在應該是四五千人,他們主要是為我們標註數據。還有第三部分,就是我們合作醫院的頂級專家,作為我們的外腦,會一起討論方向性的事情。

最終,依圖是要做全病種輔助診斷還是什麼?如何理解依圖的醫療業務定位?現在有公司嘗試做全病種綜合型診療產品,這其中的挑戰主要是哪些?因為每個科室診斷流程、方法等區別很大。

對,這個還比較困難。各個疾病都有獨特的地方,非常難。對醫生自身也都是挑戰,消化科的醫生,看不了呼吸科的病。換到計算機的世界,目前也還是做不到。在計算機的世界裡,演算法是非常類似的,但數據不一樣,主要是數據的問題。

當然,從數據理解上是從頭開始,但肯定是建立了一個我們研發的框架,然後這個演算法體系裡面有非常多的基礎設施工具,能讓你把成本縮減到原來的三分之一、四分之一。比如我們現在擴展一個新病種,在病種控制里擴展一個新的病種,兩周時間就夠了,可能我們第一個病種做了快兩年,然後第二個病種兩周時間就夠了。

在決策支持這個領域也是一樣,不會那麼快,因為這個領域醫學理解的問題更多,我們原來開發一個肺癌診斷,就要好幾個月的時間,做到能夠市場化的階段,也要一年多。現在我們第二個產品做骨齡的時候,基本上三個月的時間,所以是在不斷加速的。

整體上來說,短期內我們是想做臨床路徑的優化者,長期是要做智能醫院的建設者,這是我們一個大目標。

具體到病種的維度來看,我們絕對做不完所有病種,一般一個大病種類型都有一千多甚至幾萬種細分到亞型,不可能做得完。我們的邏輯還是腫瘤、心血管和兒科三個大方向,這是我們三到五年內都會非常聚焦的。

另外,我們也不會沿著臨床一直做到底,我們是在臨床主要路徑上去做優化,之後促進整個臨床效率的提升,但它不會只局限於為醫院服務,也會為患者做一些服務,讓患者跟醫療設施、醫療體系能夠更好地連接。

這類服務怎麼理解?是下一步要自己做的,還是藉助對外的一些合作。

你要為患者服務,你得搞清楚醫療過程,所以我們要先把臨床路徑這件事情做好,再回過頭去看怎麼為患者服務。你吃透了行業邏輯就可以為他服務了,所以現在我們在第三條線上做一些嘗試,就是為了最終要做的這件事情,C 端跟醫院連接就是其中一部分,當然這種目的都是為了更好地服務患者。

以前患者不在其中,現在患者也參與在其中,拿個手機可以進行人機交互。他來問問題,然後你去給他回答、給他一些風險提示等,現在我們開始在這個階段的探索。

這是獨立的 APP 嗎?還是什麼?

是個微信小程序。

是一個你們自己做的,還是也要放進別家平台上?

我們自己做的,會跟醫院端打通,也會植入在一些入口級的平台,比如挂號軟體,或者是醫院自己的公眾號。我們現在還在小範圍測試的階段,在一些醫院裡面在試用。

它是一個輕問診的工具。

它不會給一個非常明確的結論,結論性的東西現在國家也不讓給,然後我們主要是盡量全面地收集用戶的病情,之後會提示患者可能有什麼樣的風險,你得進一步觀察什麼指標。然後下一步,我們打算把它做成一個知識性的東西。

有沒有可能我諮詢完了,去醫院見醫生的時候不用再重複溝通?

說得很對,因為醫生十分鐘看病大概七分鐘問病情,所以交互完了之後,在醫生的電腦上他直接能看到你跟程序交互的內容。

包括分診應該也可以做到?

分診是最容易的事情,我們現在做的事情是叫預檢,就是說一般常見疾病去看醫生,可能有 80% 需要做檢查。

比如兒科,醫生開一堆化驗單,患者要去驗血等等然後等拿到化驗結果再回來找醫生,這個系統現在會直接給患者開個驗血單,你不用去見兩次醫生。這就是我說的臨床路徑上的部分優化,醫院還是非常歡迎的,只是有一些倫理問題我們要去解決,比如說國家規定只有醫生才能開檢查單。

不過這也會有一些辦法,比如說我們把所有要驗血的判斷需求放到一個系統里,醫生可以在電腦上確認操作,對醫生、患者來說,就診效率都會提升很多。

早一步發現疾病問題一直是新技術融合到醫療領域想要完成的目標,但關於輔助診斷、預測等醫療問題,其實一直都缺乏標準,依圖怎麼看現在的行業狀況?在這方面,你們怎麼理解以及有什麼舉措嗎?

這是一個問題,所以我們說內行人都談標準,標準是很重要的一個事情。我們現在在用技術的方式,把早期篩查的標準確定下來。但是人工智慧是能夠幫助標準可被執行,原來大家對標準的解讀是不一樣的,人工智慧的模型能夠讓各個地方都採用同樣的標準。這個模型,不管在哪個地方,它執行的效果其實都一樣,這就是一個技術對於標準的貢獻。

依圖目前在醫療業務的合作是如何收費的?是否有收入方面的數據可以透露?之前有媒體報道里看到依圖稱一些合作夥伴為種子醫院,這類合作主要承載什麼樣的需要?

不同的產品是不一樣的,有的產品是提升醫生效率,有的產品是為患者帶來更多價值,而不只是說變得更准。所以,有的以賣一個軟體給醫院,有的以賣服務的方式給醫院,去做一些分成。

目前收入狀況是怎樣的?

我們有收入,但是收入幾乎都不來自於這些產品。因為沒有證,所以需要證的這些產品是都沒有收入的,然後不需要證的產品,像我們做的第一條線——科研平台,它本身是一個比較偏向於技術的,它不要證,所以這是有一些收入的。

目前為止,有兩筆戰略投資,分別是 AI 晶元和 AI 製藥,依圖的投資邏輯是什麼?布局 AI 生態還是什麼?比如醫療領域這家公司會和依圖在業務層面形成深度互動嗎?

AI 晶元在整個 AI 的生態裡面未來會是一個非常有深度的競爭點,特別是對不同的行業去定製不同的 AI 晶元解決方案,可能成為核心競爭力;至於 AI 製藥的業務,本身醫療臨床路徑就是少不了藥品的,隨著我們在心腦血管領域的深入,我們發現製藥這件事情是大有可為的,在這兩個層次可以形成深層次的合作。


推薦閱讀:

肖仰華:基於知識圖譜的可解釋人工智慧:機遇與挑戰
北大AI公開課 第四講 無人駕駛
《小王愛遷移》系列之十四:用於部分遷移學習的深度加權對抗網路
中國電科布局新一代人工智慧專項行動計劃
金字塔注意力網路:一種利用底層像素與高級特徵的語義分割網路

TAG:人工智慧 | 醫療 | 醫學影像 |