機器如何做「閱讀理解」？

04-30

在那些寒窗苦讀的學生時代，在無數個奮筆疾書的考場上，你一定碰見過一種作業題型——「閱讀理解」。

中文不夠英文來湊（圖片源於網路）

它需要融會貫通進行主觀陳述和作答，是難度係數比較高的題型之一。其實「閱讀理解」並不是人類才有的「苦惱」，機器也同樣需要過這一關。

就著閱讀理解這事，科大訊飛AI研究院副院長王士進和研究主管崔一鳴今天將和大家聊聊背後的故事——他們的團隊已連續在機器閱讀理解的比賽上摘得全球桂冠。

科大訊飛AI研究院副院長王士進

路遠，也要走

今年2月10日，在SemEval 2018國際語義測評大賽的機器閱讀理解評測任務中，哈工大訊飛聯合實驗室(HFL)榮獲桂冠。在此之前，從去年7月開始，實驗室已在機器閱讀理解領域權威評測大賽SQuAD連續3次刷新世界紀錄。

國際語義評測閱讀理解任務最終榜單：哈工大訊飛聯合實驗室排名第一

「給定一個日常生活場景的描述文本及相關問題，我們需要利用常識和知識讓機器從候選答案中挑選出正確答案。」這其中利用了機器閱讀理解的相關技術，「我們把從融合式層疊注意力系統分拆的技術，應用到其他自然語言處理任務中。」

SemEval 2018 國際語義評測冠軍系統描述

閱讀理解先審題後答題，這其中蘊含了一整套邏輯理解的關係，人處理起來都不太容易、機器如何擁有這項能力？「其實人和機器的解題過程有區別。」

崔一鳴介紹，人在審題和做題的時候通常要結合自身已掌握的常識和知識，並且綜合全文的信息做進一步歸納、推理，這個過程相對較為多元化。

而對於目前的機器來說，首先需要「閱讀」大量的篇章和問題，並且計算出篇章、問題之間語義級別的匹配程度，從而更好地抽取出與解題相關的內容。「所以對於機器來說，更能夠答好之前見過的問題，而缺乏一些多元化、綜合解題的能力。」

說得坦率些，雖然目前機器在某些閱讀理解數據集上的水平超過了人類，但這並不能表明「機器打敗了人類」。「現在的技術距離通用型人工智慧其實還很遠，機器還無法能夠模擬很多人類的智能。」王士進解釋，通用性不夠強、需依賴大量有標註的數據，都是目前機器閱讀理解的局限性。

讓機器能理解會思考，讓機器具備真正的推理能力，其實還有很長一段路要走。「理論框架上必須進行突破，而不是簡單的升級。」王士進這樣認為：首先機器要能從海量數據學會推理、掌握知識和常識，然後還需要機器從小樣本數據上學會同樣的事情。

情理之中，意料之外

因為有這樣的研究目標，拿獎對於AI研究院而言，似乎是水到渠成。「SemEval2018上奪冠從時間上是意料之外，但從技術角度來說也是情理之中。」

事實上，準備這項大賽，團隊只用了1個半月左右。「因為當時在工程項目上需要進行技術攻關，偶然了解到今年這項比賽中有機器閱讀理解的任務，便抽出部分時間來參與。模型設計花費了1-2周，後續還做了參數調整和效果優化。」崔一鳴坦言，對於新任務團隊本也沒有十足的奪冠把握，只是從技術積累看有希望。

「冠軍不是目標，只是我們技術的試金石，體現的是核心技術的領先優勢。」坐擁機器閱讀理解領域的多項世界紀錄和世界冠軍，團隊顯得既霸氣又謙虛。

而今，在被譽為「人工智慧領域皇冠上的明珠」的機器閱讀理解大賽中，除了幾家常駐的研究機構之外，還有來越多的科技公司、甚至互聯網公司、創業公司加入，「這樣有助於促進該領域技術的進步。」

對於科大訊飛而言，如果參賽卻沒有拿到冠軍，是不是意味著失敗？「勝敗乃兵家常事，技術的發展是螺旋式、曲折式的上升發展，我們有耐心去包容這樣的『失敗』。」

也許正如那個道理：任何領域都沒有常青樹。技術上亦如此，為了獲得持續發展的源動力，我們不僅自己拿冠軍，還在幫助別人拿第一。

崔一鳴透露，2016年科大訊飛發布了首個中文填空型閱讀理解數據集PD&CFT。2017年，科大訊飛攜手中國中文信息學會計算語言學專委會（CIPS-CL）共同舉辦了首屆「訊飛杯」中文機器閱讀理解評測（CMRC 2017），並與全國計算語言學會議（CCL）共同召開，為相關學者提供了一個良好的溝通平台。

CMRC 2017 獲獎名單一覽

今年，我們還會繼續舉辦第二屆「訊飛杯」中文機器閱讀理解評測（CMRC 2018），和更多研究人員共同推動中文機器閱讀理解的研究發展。想要報名？請點擊鏈接：第二屆「訊飛杯」中文機器閱讀理解評測

有些「瑕疵」，不礙事

從某種意義而言，讓機器能「閱讀理解」是人工智慧向著高階發展的嘗試。機器能理解、會思考，就是我們常常所說的認知智能。它主要體現在人機交互和行業應用上，「認知智能的發展和逐步成熟，會使得人機交互逐漸便捷有效，會學習和固化行業專家和行業大數據的經驗，對各個行業產生顛覆式的創新。」

相關的應用已經開始。王士進說，目前訊飛在多個應用領域使用自然語言處理等技術促進產品幫助人類。比如訊飛的「智醫助理」在去年全球首次參加並通過國家執業醫師資格考試筆試評測；比如通過人工智慧的知識圖譜和習得順序分析可以精準分析每個孩子的學習情況，從而有針對性的布置個性化作業，大幅降低無效重複學習時間……

智醫助理最近已經正式「上崗」了

機器閱卷也同樣需要機器閱讀理解的技術

對語言本身的處理和應用也有更廣的嘗試。「訊飛聽見會議系統可實時將語音轉寫成文字，不僅有中文還有英語；訊飛翻譯機也已具備了7種語言的互譯功能，未來還將開發更多國家語言翻譯功能，布局相關語種的語音識別技術、語音合成技術、機器翻譯技術。」

訊飛翻譯機成為2018年博鰲亞洲論壇官方指定翻譯機

有沒有不太滿意的地方呢？瑕疵肯定存在，王士進以智能閱卷技術的應用舉例，坦言計算機評分也存在錯誤的情況，但這並不妨礙研發、應用的大勢，「未來，隨著人工智慧技術的發展，機器可以自動學習教師的評卷方法，除了開放式作文，在其他科目、甚至政史地問答題等試題的批閱中，機器都可以自動閱卷。」如此將大大解放教師們時間和精力，「他們將投入到對教學方法、教學手段等創造性工作的研究中，相學生們也會因此獲得更好、更全面的教育。」

所以，「閱讀理解」只是開始，包括訊飛AI研究院在內，攻克它只是核心技術研究上的一點突破，更大的意義在於構建研究生態和讓研究應用真正發揮價值。

吶，點擊鏈接：第二屆「訊飛杯」中文機器閱讀理解評測 報名第二屆「訊飛杯」中文機器閱讀理解評測！本屆評測報名截止時間為2018年4月22日，抓緊時間哦~~~

更多機器閱讀理解相關介紹，請上傳送門：

科大訊飛：AI助手人人有，「人機耦合」跟我走?

zhuanlan.zhihu.com科大訊飛：863項目牽頭單位科大訊飛告訴你高考機器人到底怎麼考？?

zhuanlan.zhihu.com科大訊飛：科大訊飛認知智能持續突破機器閱讀理解SQuAD測試獲得第一！?

zhuanlan.zhihu.com

文