韋福如:不只讓機器人懂聊天|「35歲以下科技創新35人」中國榜單
來自專欄 DeepTech深科技
自 1999 年起,《麻省理工科技評論》每年都會推出「35歲以下創新35人」(Innovators Under 35)榜單,旨在於全球範圍內評選出被認為最有才華、最具創新精神,以及最有可能改變世界的 35 位年輕技術創新者或企業家,共分為發明家、創業家、遠見者、人文關懷者及先鋒者五類。
2017 年,該全球權威榜單正式推出中國區評選,並已公布並首屆評選結果。現在,《麻省理工科技評論》正式開設「35歲以下創新35人」中國榜單專欄,以人物報道的形式幫助中文讀者了解這些來自中國的新生代科技力量。
韋福如·發明家
懷抱自然語言處理科研夢想的發明者
獲獎年份:2017 年
獲獎時年齡:34
獲獎時職位:微軟亞洲研究院資深研究員
獲獎事由:在自然語言處理(NLP)和自然語言理解技術領域取得重大突破,在機器閱讀理解,識別和理解情感、觀點以及情緒,智能問答和對話等關鍵課題上持續研究和創新。並進一步完成利用深度學習和自然語言處理技術進行輔助音樂創作,讓計算機也能作詞和作曲,探索人工智慧思考創作的可能。
如何讓聊天機器人成為真正可以幫助我們提升工作效率、讓生活更方便的實用工具,讓我們與機器的對話能夠更智能、更自然,一直是全球人工智慧研究者積極投入的熱門領域。這個領域所牽涉到的自然語言處理與理解技術,也是最具挑戰性的前沿研究技術題目。
之前在電視節目中,微軟的人工智慧聊天機器人微軟小冰演示了自己完成作曲作詞等音樂創作的過程,讓外界見識到人工智慧技術研究的進步,而微軟小冰作詞作曲驚艷表現背後的主要推手,就是微軟亞洲研究院韋福如與他率領的團隊。
不僅如此,韋福如所帶領的團隊所構建的端到端的深度神經網路模型 R-NET,在被譽為「機器閱讀理解領域 ImageNet」的 SQuAD(Stanford Question Answering Dataset)文本理解挑戰賽中持續蟬聯榜首,且 R-NET 在單模型和集成模型中都處於頂尖水平。2018 年 1 月 3 日提交的 R-NET 模型更是在 EM 值(Exact Match,表示預測答案和真實答案完全匹配)上以 82.650 的最高分領先,並率先超越人類分數 82.304。這是計算機文本理解能力首次超越人類,預示著未來相關人工智慧應用將有更多的發展和突破。
微軟亞洲研究院資深研究員韋福如以發明家類別成為本年度中國區 35 歲以下科技創新青年獲獎人。他與自然語言處理研究的緣分自攻讀博士時就已展開,博士期間在香港理工大學計算機系擔任訪問學者時,韋福如就開始從事自然語言處理相關的研究工作,而後進入微軟亞洲研究院自然語言計算組。在過去的十年,韋福如的研究涉及自然語言處理領域的多個關鍵課題,包括文本挖掘中的情感分析和意見挖掘、智能問答對話以及機器閱讀理解與摘要等等。
從小在一個重視教育的家庭長大,韋福如說自己一直是好學生,勉強也算是學霸。的確,17 歲考入武漢大學計算機學院、保送碩博連讀、26 歲就獲得博士學位,這樣的學習經歷確實耀眼。
圖 | 韋福如
出色的學習表現,只是起步,韋福如說對他最重要的影響,是「認真且堅持的習慣,因為習慣的力量很多時候都超出了我們的想像,這對我後來的工作和生活都有深刻的影響。」
正因為此,韋福如在學術研究領域繳出了亮眼的成績單,在自然語言處理的頂級期刊和國際會議,如 Computational Linguistics、 ACL、 EMNLP、 COLING、 SIGIR、 AAAI、 IJCAI 等,累計發表超過 90 篇論文,其中包括兩篇自然語言處理最頂級期刊 Computational Linguistics 的論文,以及 15 篇自然語言處理最頂級國際會議 ACL 的論文。截至 2017 年 12 月,根據 Google Scholar 的統計結果,韋福如所發表的論文被引用次數已超過 3400 次,H 指數為 30。
在研究成果的實際應用方面,韋福如與團隊的研究成果也廣泛應用到了多項微軟的產品中,包括外界已然非常熟悉的聊天機器人微軟小冰、必應搜索引擎、Office 辦公軟體以及微軟認知服務等。
除了在機器閱讀理解領域取得的巨大的科研成就。韋福如的研究領域還包括從文本中識別和理解情感、觀點以及情緒的工作,以更好地實現計算機對社交媒體用戶情感變化的預測,在網路評論中監測人們對產品、品牌等監測目標的態度和意見,以及在聊天機器人和人類的對話互動中建立類似人與人之間的關係,等等。這部分研究成果已經被應用到微軟必應搜索引擎、微軟認知服務中的情感分析 API、微軟小冰中。其中,韋福如研發的情感分析引擎還用於從推特(Twitter)等社交媒體中生成情感信號,提供給微軟必應引擎,來預測電視選秀節目以及社會事件發展的結果。
此外,韋福如還涉及了智能問答和對話系統的研究工作。其中一些技術研究已應用於 Skype 中的生成對話回復建議,從而提高了生產效率及用戶參與度。未來也可以應用於生成郵件回復建議,如在 Outlook 手機版中應用。
自然語言處理作為人工智慧研究的核心領域之一,長久以來都受到廣泛關注,被認為是人工智慧皇冠上的明珠。微軟全球執行副總裁沈向洋就曾說,懂語言者得天下,自然語言將是人工智慧對人類影響最為深刻的研究領域。因為,自然語言理解的研究成果和技術創新將會不斷改變人與機器交流的方式,進而改變人類的生活方式。
過去 10 年,韋福如沉浸於自然語言處理領域研究並持續提出創新成果,回顧自己的研究與創新之路,他認為驅動研究項目創新的關鍵就在於選擇好的課題。選擇研究課題是研究過程中最重要的環節之一,需要結合個人研究興趣和工作業務需求,考慮長期的研究方向和階段性的成果輸出(例如產品合作等),還要把握研究的節奏並設定里程碑,在創新和實用上求交集(要做有用的研究),並尋找合適的切入點,在熟悉已有工作的基礎上,找到核心的研究點並突破。
談及研究與創新的品味風格,韋福如認為,研究的過程中大部分工作可能都是不成功的,但這就是研究本身的特性,所以需要積極面對,並持續創新。通過這樣的過程積累經驗,進而逐漸形成自己研究和創新的品味和風格。
目前,儘管自然語言的研究和應用取得了長足的進步,也得到了廣泛的應用,但大部分的成果都是來自大規模的數據,越來越多的用戶場景和用戶反饋,越來越強大的計算力,以及現階段尚是黑盒的深度學習演算法。然而,很多場景由於缺乏高質量的數據,尤其是有標註的數據,目前演算法和技術還是一籌莫展。
而這正是韋福如眼前所看到的未來,他說:「人們對於自然語言理解的原理、解釋還知之甚少。我希望通過科研上的努力,可以讓機器真正能夠理解人類的自然語言,為更多的人帶來智能、便捷的計算體驗,服務人類和社會。」
看似平淡的幾句話,卻是韋福如想要突破研究極限、改變世界的熱情,他的研究夢想,不只是通過自然語言讓人與機器說話,更要經由機器,讓人類站到世界的前沿直接與未來對話。
推薦閱讀:
※關於增強學習你應該了解的五件事兒
※關於並聯機器人
※【原創機器人教學案例】無用機:一個把自己關掉的機器,多像個叛逆的孩子
※目睹了一場機器人驅動引發的爭論,我出來「闢謠」了!驅動系統辣么多,你要選哪種?
TAG:機器人 |