AI正努力成為"華佗"：你希望未來醫生是人還是機器

02-24

本文系網易智能工作室（公眾號 smartman163）出品。聚焦AI，讀懂下一個大時代！

【網易智能訊 2月4日消息】人工智慧已經被世界各地的醫院所採用，但是把人工智慧引入醫療保健並不一定是為了讓機器與人類大腦相對抗。人工智慧在檢查室里拓展、完善醫生的工作，確保他們更好地對病人進行診斷。

「21世紀的聽診器」

被稱為「醫學界的未來學家」的Bertalan Meskó將人工智慧稱為「21世紀的聽診器」。他的評估可能比他預想的更加準確。儘管各種技術和測試為醫生們提供了診斷和治療患者所需的全部信息，但他們已經負擔了大量的臨床和行政責任，而且對大量可用信息進行分類是一項令人望而生畏的任務。

這就是人工智慧這個「21世紀的聽診器」可以發揮其作用的地方。

然而，人工智慧在醫學領域的應用並不局限於「行政工作」。從強大的診斷演算法到精細的外科手術機器人，這項技術正使其在醫學學科中得到廣泛應用。顯然，人工智慧在醫學領域佔有一席之地;我們尚不清楚的是它的價值。想像未來人工智慧會成為病人護理團隊的一部分，我們首先必須更好地了解人工智慧是如何與人類醫生相比較的。在準確性方面誰更出色？人工智慧有哪些具體的、或者獨特的貢獻？在醫學的實踐中，人工智慧在哪些方面將會是最有幫助的？他們可能潛在對人體帶來傷害嗎？只有當我們弄清這些問題之後，我們才能開始預測，然後建立我們想要的、以人工智慧為動力的未來。

人工智慧vs.人類醫生

雖然正處於發展的早期階段，但人工智慧已經具備了與人類醫生同樣的診斷病人的能力。英國牛津大學教學醫院約翰·拉德克利夫醫院的研究人員開發了一種人工智慧診斷系統，這種系統比醫生診斷心臟病的準確率更高，目前至少在80%的情況下是這樣。在哈佛大學，研究人員發明了一種「智能」顯微鏡，可以檢測出潛在的致命的血液感染，研究人員在10萬張圖像上對AI輔助工具進行了訓練，而這些圖像來自25,000張用染料處理的幻燈片，這樣可以使細菌更容易被發現。人工智慧系統已經可以對這些細菌進行分類，準確率達到95%。日本橫濱昭和大學的一項研究顯示，一種新的計算機輔助內鏡系統可以顯示結腸癌的潛在癌症生長跡象，靈敏度為94%，特異性為79%，準確性為86%。

在一些情況下，研究人員還發現，在那些需要快速做出判斷的挑戰性診斷中，人工智慧的表現要優於人類醫生，比如判斷病變是否癌變。在2017年12月發表在《美國醫學會雜誌》（Journal of the American Medical Association）上的一項研究表明，深度學習演算法比人類放射學家在「時間緊迫」時更能診斷出轉移性乳腺癌。儘管人類放射學家在沒有限制的時間內來回顧病例時，可能會做得很好，但在現實世界中（特別是在像急診室這樣的大容量、快速周轉的環境中），是否能夠快速作出診斷可能會直接決定病人的生死。

當然，還有IBM的沃森，挑戰從腫瘤細胞的遺傳數據中收集有意義的見解時，人類專家花了160個小時來回顧並根據他們的發現提供治療建議。而沃森只用了10分鐘就提出了同樣可行的建議。谷歌最近發布了一個開源工具DeepVariant,，它是谷歌分析遺傳數據的人工智慧工具，在去年的「精準FDA」真理挑戰賽(PrecisionFDA Truth Challenge)中，它是同類產品中最準確的工具。

人工智慧在對健康狀況的預測上，也比人類表現更好。今年4月，英國諾丁漢大學的研究人員發表了一份研究報告，研究顯示，通過對37.8萬名患者的大量數據進行訓練，自學成才的人工智慧預測病人心血管疾病的幾率比目前的標準高出7.6%。為了更好地理解這個數字，研究人員寫道：「在大約83000條記錄的樣本中，這相當於有額外355名患者的生命可以得到挽救。」或許最值得注意的是，神經網路也減少了1.6%的「假警報」，即風險被高估，這可能導致病人進行不必要的手術或治療，增加不必要的風險。

在理解和處理大量數據方面，人工智慧是最有用的，因為這些數據對人類來說可能太過龐大。這也正是不斷發展的精密醫學領域所需要的。希望填補這一空白的是Human Diagnosis Project（Human Dx）項目，它將機器學習與醫生的實際經驗結合起來。該組織正在收集來自80多個國家的7500名醫生和500個醫療機構的信息，以便開發一個系統，病人、醫生、組織、設備開發人員或研究人員都可以訪問這個系統，並可以據此做出更明智的臨床決策。

非營利組織Human Diagnosis Project的主任Shantanu Nundy告訴Futurism，在任何行業發展技術的時候，人工智慧應該無縫地整合到它的功能中去。「你必須把這些東西設計成使用戶受益的。人們使用Netflix，但它並不像「放電影的人工智慧」，對嗎？人們使用亞馬遜，但它也不像「購物的人工智慧」。」

換句話說，如果這項技術被設計得很好並且以人們認為有用的方式實現，人們甚至不會意識到他們在使用人工智慧。

對於思想開放、有遠見的臨床醫生來說，像Huma Dx這樣的項目的直接吸引力在於，與直覺相反，它可以讓他們少花點時間在技術上。「有證據表明，我們現在50%的時間都在屏幕前，」Nundy對Futurism說。他也是華盛頓地區的一名執業醫師。人工智慧可以為醫生減輕一些行政負擔，比如整理文檔，從而為醫生節約更多的時間。

優化移動健康APP：理解人性及關注心理健康

而在醫療保健方面，人工智慧並不一定要取代醫生，而是要優化和提高他們的能力。

位於波士頓的人工智慧和行為分析公司Cogito的移動健康部門首席行為科學官Skyler Place告訴Futurism，「我認為人工智慧今天的價值在於協助人類，而不是取代人類。」

Cogito一直在使用基於人工智慧的語音識別和分析，以改善許多行業的客戶服務交互。該公司進軍醫療保健領域的舉措是一款追蹤患者行為的心理健康應用，Cogito Companion。

這款應用可以監控病人的手機，包括主動和被動的行為信號，比如可以顯示患者幾天沒有離開家的位置數據，或者是一些通訊記錄，表明他們已經有好幾周沒有在手機上發簡訊或打電話了（該公司稱，這款應用只知道病人是否在用手機打電話或發簡訊——它不追蹤用戶的來電或通話內容）。病人的護理小組可以監測隨後的報告，以發現這些跡象所表明的病人的整體心理健康狀況的變化。

Cogito已經與全美數家醫療保健系統合作，對這款應用進行了測試。測試發現，這款應用已經在老兵群體中佔據了一席之地。退伍軍人面臨著被社會孤立的高風險，但他們可能不願意與醫療保健體系打交道，尤其是精神衛生資源，因為他們會感到羞恥。「我們發現，這款應用是一種建立信任的方式，可以在更廣的範圍內推動醫療服務的參與，」Place說，並補充說這款應用「實際上充當了行為改變的引物」，這似乎可以幫助退伍軍人感到自己被授權和願意參與心理健康服務。

這就是人工智慧的用武之地：該應用還使用機器學習演算法分析病人的聲音記錄（有點類似於音頻日記）。這些演算法的設計目的是捕捉情感線索，就像兩個人在說話一樣。「我們能夠構建出與人們說話方式相匹配的演算法，比如能量、語調、談話中的活力或流程，」Place解釋道。

從那裡，人們訓練演算法來學習「值得信賴」或「勝任」的聲音，識別抑鬱的人的聲音，或者是躁鬱症患者在躁狂和抑鬱時的聲音差異。這款應用不僅可以為患者提供實時信息，幫助他們追蹤自己的情緒，但這些信息也可以幫助醫生追蹤病人的病情進展。

在Cogito，Place已經看到了人工智慧幫助我們「理解對話中的人性方面以及人類心理健康的方方面面」的能力。理解是第一步。但我們的最終目標是找到一種有效的治療方法，這也是目前醫生與精神健康問題密切相關的地方。但是，當涉及到更實際的事情時，機器人會扮演什麼角色呢？

機器人手術

在過去的幾十年里，人工智慧領域最引人矚目的應用之一就是外科機器人的發展。

在大多數情況下，手術機器人（最著名的是「達芬奇」機器人）的功能是協助人類外科醫生，在附近的控制台控制設備。但2010年，在加拿大蒙特利爾進行了一場有野心的手術。手術機器人及機器人麻醉師（被稱為McSleepy）進行了第一次串聯表演，並號稱是世界第一。在手術過程中收集的數據反映了這些機器人醫生出色的表現。

2015年，在第一批手術機器人進入手術室10多年後，麻省理工學院對FDA的數據進行了回顧性分析，以評估機器人手術的安全性。在研究期間，報告了144例患者死亡和1391例患者受傷，這些主要是由於技術困難或設備故障所致。報告指出，「儘管死亡和受傷數量相對較多，但絕大多數程序都是成功的，沒有任何異常。」但是，在更複雜的外科手術領域（如心胸外科）中發生的患者死亡和受傷的事件數量要比婦科和普通外科等領域要高得多。

看起來，機器人手術在某些專業領域表現良好，但更複雜的手術最好留給外科醫生——至少現在是這樣。但這種情況可能會很快發生變化，而且由於手術機器人能夠獨立於人類外科醫生的操作，所以當出現問題時，要決定誰應該受到責備將變得更加困難。

一個病人可以起訴機器人的過失行為嗎？由於這項技術還相對較新，在這種情況下的訴訟是法律上的灰色地帶。傳統意義上，專家認為醫療事故是由於醫生疏忽造成的，或者是違反了規定的醫護標準。然而，過失的概念暗示了一種內在缺乏的意識，但是機器人所遵守的是已經存在的一些性能標準。

所以，如果不是機器人的話，誰，或者什麼，應該承擔責任？一個病人的家庭能否讓負責監督機器人的人類外科醫生負責？或者，製造機器人的公司應該承擔責任嗎？機器人的設計者呢？這個問題目前還沒有明確的答案，但它需要儘快被解決。

創造未來，而不是預測未來

在未來的幾年裡，人工智慧在醫藥領域的作用只會越來越大：在埃森哲諮詢公司撰寫的一份報告中，人工智慧在2014年的市場價值為6億美元。到2021年，這一數字預計將達到66億美元。

這個行業或許正在蓬勃發展，但我們不應該匆忙或隨意地整合人工智慧。部分原因是，對人類來說合乎邏輯的事物不一定適用於機器。以人工智慧被訓練來確定皮膚損傷是否具有潛在的癌變可能為例。在現實中，皮膚科醫生經常用尺子來測量他們懷疑是癌變的病變。據The Daily Beast網站報道，當人工智慧在這些活檢圖像上被訓練時，如果圖像中有尺子，人工智慧就更有可能說病變是癌變的。

演算法也可能會繼承我們的偏見，一部分原因是由於用於訓練人工智慧的材料缺乏多樣性。在醫學方面，機器接受的數據很大程度上取決於誰在進行研究，以及在哪裡進行研究。白人男性仍然在臨床和學術研究領域佔據主導地位，他們也構成了參與臨床試驗的大多數患者。

醫療決策的一個原則是，一個手術或治療的好處是否大於風險。當考慮人工智慧是否已經可以與手術室里的人類外科醫生平起平坐時，一點點的風險收益和平等分析將會大有幫助。「我認為，如果你和正確的利益相關者一起建立技術，並且投入額外的努力去實現包容性，那麼我認為我們可以改變未來，」Human Dx的Nundy說。「我們正在努力塑造未來的格局。」

儘管有時我們擔心機器人會率先將人工智慧整合到醫學領域，但人類是進行這些操作的人，最終推動變革的是人類。把人工智慧運用在哪裡是由我們決定的，而最好的做法是用傳統的方法。醫生可以用人工智慧作為工具來開始構建他們想要的未來，這對他們和他們的病人來說是最好的未來，而不是試圖預測醫生在20年後將會是什麼樣子。

（選自：Futurism 編譯：網易智能參與：李擎）