三角獸CTO亓超:人工智慧語義技術是如何「解歧義」的|Xtecher人物

自然語言理解永遠面臨歧義的挑戰。「這本書是黃色的。」那這本書是「黃色的」,還是「黃色的」呢?

深耕NLP近二十年的亓超,相繼被阿里、騰訊、微軟、百度聘請,成為了少有的BAT+微軟「通關」的工程師。如今身份切換到創業者,他希望在語義技術方面有更大的突破。

「倒一杯啤酒倒急了,這個泡沫肯定會有,」亓超說,「泡沫總會有散去的那天。我們要保證的第一件事,就是泡沫散去的時候,我們還在。」

作者|左左

編輯|甲小姐、歐拉拉

網址|Xtecher

微信公眾號ID|Xtecher

「您好,我是亓超(qí chāo)。」

和Xtecher初次聯絡時,亓超很細心地將自己並不常見的姓氏拼音一併發送過來。這是一個很少出現在大眾視野中的人,但他所創造出的產品,你一定會知曉。

2014年,微軟推出第一款人工智慧伴侶虛擬機器人「微軟小冰」,引發業內和市場熱議,亓超是當時研發團隊中唯一一位負責核心演算法的工程師;2015年,亓超又參與研發了百度在人工智慧領域戰略布局的重鎚產品——人工智慧機器人秘書:度秘。

同他的華麗履歷形成鮮明對比的,是他匆忙隨意的穿搭。黑色寬鬆的西褲加上灰色略瘦的T-shirt,襯衫角凌亂散落在外面。幾縷髮絲搭在眉前,彷彿在控訴主人那爭分奪秒的睡眠。

毋庸置疑,亓超是NLP領域最優秀也最幸運的工程師之一。無論是微軟小冰,亦或是百度度秘,都開創了里程碑式的先河——但即使是這兩款非常令人矚目的產品,都沒有達到亓超心中最理想的目標,他希望能夠衝破局限,走出屬於自己的路。

創業一年

去年,人工智慧迎來新一波上升期,他覺得時機到了,思慮再三後,亓超決定出來創業,不再做抱著大樹的藤蔓,力圖在自己的構思中將語義技術做得更為透徹。

隨即,他和在百度結識的倫敦大學博士後王卓然碰了一下,兩個人想法不謀而合,王卓然不但爽快答應,還拉來了中學同學——連續創業者,且擁有十年市場經驗的馬宇馳。以三人為核心的團隊雛形就此搭建完畢,實力雄厚且方向互補:CEO王卓然在任務驅動的多輪對話技術上有紮實的理論,CTO亓超在開放域聊天方面有豐富的實踐,COO馬宇馳在對外公關和市場運營上有深厚的經驗。

左起:CEO王卓然,CTO亓超,COO馬宇馳

決定創業後的第一個問題來了:公司起個什麼名字好呢?

「我們一共三個人,就叫三角獸吧。狼群夠所向披靡吧?可也會遇到難啃的骨頭。我們的團隊要聚合多樣化的人才,我們希望建造一片廣袤的森林,讓更多不同種類的獸類貢獻出不一樣的力量。」

對於一家技術公司的第一年而言,三角獸是幸運的。

成立於2016年2月份,佔盡了「天時、地利、人和」。前幾年,NLP領域幾乎不為人所知,也鮮有人看好,直到2016年3月AlphaGo一夜成名,人工智慧領域突然被引燃,資本和企業都對此顯示出極大地興趣。

2016年4月,三角獸獲得了洪泰領投、天善資本跟投的1000萬天使輪融資;8月,又完成由君聯資本領投,賽富亞洲跟投的2000萬元Pre-A輪融資。短短五個月時間,三角獸就獲得了3000萬的投資。在資本寒冬的2016,這個成績令人羨慕不已。

語義技術最大難點:解歧義

三角獸涉足兩個自然語言處理的細分領域:

第一,開放域聊天。不限定人機交流的領域範圍,可以任意聊天,就像斯派克·瓊斯導演的電影《她》那樣,男主人公西奧多可以和機器人薩曼莎無話不談——亓超之前參與的微軟小冰就屬於開放域聊天的範疇。

第二,任務驅動的多輪對話,亦叫垂直領域的多輪對話。與前者的區別在於,它是帶有目的性的,譬如去餐廳點餐,機器人會向用戶推薦最受歡迎的特色菜,目的是為了完成點餐的這項任務,屬於有任務功能的意象對話——百度度秘就屬於多輪對話的範疇。

這兩者本質上的區別是多輪對話追求「最短路徑」,希望越快越好,開放域聊天則是越長越棒,而這兩個領域,都離不開一個最為基礎又頗具難度的技術——語義技術。

什麼是語義技術?比如你對機器人說「拜拜」,則證明你要走了,語義技術就是要識別出用戶說話的表象、行為和意圖。

亓超坦言,「NLP最大的難度歸結到一點就是——解歧義。」

無論是語法分明的英文,還是博大精深的漢語,所有的自然語言都有很大的歧義。

NLP解歧義有五個層次:

1.切割詞語。以詞語的形式,把一句話或者一段話隔斷分離。

2.解詞性的歧義。同樣的一個詞,在不同上下文中可能會有不同的詞性的標註。例如:抽屜沒有鎖。「鎖」既可以作名詞,指實體的「鎖」;也可以作動詞,表示動作「上鎖」。

3.做句法的分析。這個詞語處於什麼位置,是主謂賓還是定狀補?很多話一旦到了句法的層面上,就會出現好幾種解釋。

4.理解語義。對於大多數人而言,語義上的歧義更容易被關注到。「這本書是黃色的。」那這本書是「黃色的」,還是「黃色的」呢?

5.進行語境分離。非常常見的例子是,縱使戀人之間聊天,也往往因為對語境有著各自不同的理解而觸發「世紀大戰」。

這五個層次,每往上一個層次,「歧義空間」就會愈大。

傳統NLP的做法是,人工擴大庫、人工設置匹配,一層一層地手動標註去解歧義的問題。但是很顯然,這條路既難走又不是可正向循環的發展方向。

面對這些問題,三角獸採用了深度學習的方式,用不同的向量去代替片段文章,再利用這種矩陣進行語義的理解和計算。

對此,亓超向Xtecher給出了自己的思考:

「機器喜歡的是數字,擅長的事情是存儲和計算。當人去看向量的時候是一堆數,而機器卻能做到賦予其不同的數值,從而分析出兩個句子、兩個詞語之間的距離。進而利用距離去判斷語義。」

功力不俗

2016年,AI的火爆不但使得整個行業飛速發展,也推就了很多弊端。這個高技術門檻的領域,混雜了一些噱頭公司,利用炫酷的demo鼓吹無法具備的技術,對技術非常執著的亓超對此感到擔憂。

「胡亂的吹捧後,一方面體驗不到真實產品,另一方面會拔高合作方與用戶的期待值。一旦預期無法被達到,人們會極度地失望,我們非常擔心這種事情多了以後,會對AI領域起到負面作用。」

亓超告訴Xtecher,雖然市場中有很多雜音,但三角獸主要以to B業務為主,所以並不會刻意包裝營銷自己的技術來吸引潛在合作方的眼球。他們所希望的,是將現階段的技術完全暴露出來,使之得到一些反饋,從而將技術進一步優化。

面對人工智慧的泡沫,亓超是樂觀的,「倒一杯啤酒倒急了,這個泡沫肯定會有,但任何泡沫也都是有乾貨的。隨著泡沫慢慢地消除,剩下的就是乾貨。」

三角獸的坦誠使得很多合作方更願意和他們合作。雖成立不久,卻已拿下了一些行業內有名的客戶:

鎚子新一代手機Big Bang功能的核心演算法模塊;Rokid機器人聊天系統;威馬汽車車載前裝音樂和導航模塊……此外,三角獸還有一些項目正在推進合作的過程中,其中包括百度和騰訊這樣的大企業。

雖然小試牛刀就已經在業內有很好的反響,展望關於三角獸的未來,亓超希望能做到兩點:

第一,把目前領域的技術更新至愈發完美,並且要做好任務工具化和開發者工具化;

第二,不光和人工智慧相關的企業進行接觸,還希望能將NLP推進到人們的日常生活中去。

「人工智慧的技術在我看來,就像是電一樣,它能驅動很多事情的發展。電在剛被發現的時候控制得不太到位,到現在依然沒有被完全控制,但這並不妨礙它在日常生活里應用。所以,若要等到AI技術變得完美時再去運用是很不現實的;正確的方向是,AI必須在日常生活中逐漸廣泛應用,才會獲得更多的反饋及驅動力去進行技術迭代。」亓超對於還在初期發展中的AI是這樣認為的。

一經問世就大獲好評,三角獸的產品效果究竟達到了怎樣的水平呢?

亓超告訴Xtecher,曾經有「老司機」調戲三角獸和鎚子共同打造出的Big Bang,輸入了如下的句子:

「科技處女幹事每月經過下屬科室都要親口交代24口交換機等技術性器件的安裝工作」

測試出的結果令人大吃一驚,Big Bang非常完美地避開了所有陷阱,足見在語義領域三角獸的功力的確不俗。

隨著團隊規模不斷擴大,亓超在人才篩選上表現得十分謹慎,他有一套自己的招人方式。

「不看出身」,做NLP領域的人本身就很少,亓超不在意員工原來做過什麼,他更在意的是員工將來會做什麼。

亓超認為,作為一家創業團隊,尋找有共同理想的成員是非常重要的。三角獸不會用高薪挖人,但在薪資上絕不會虧待團隊,「純靠情懷是不靠譜的,我們會比BAT的薪資向上浮動一層,每個人都要吃飽肚子,三角獸一定得保障大家的生活質量。」

目前三角獸團隊成員近三十個人,在「九九六」工作制度下,每一位成員仍可以將熱情與心血傾注,因此形成了一個堅實又牢固的團隊。

三角獸團隊

前傳

很多技術大牛的天資都在童年時已經顯現,但亓超回憶起自己的童年,就說了兩個字:普通。在高考時,亓超考入到遼寧科技大學的計算機系。他對這個專業一無所知,僅憑著年少時的熱血,就一頭扎了進去。

他當時並沒想到,這一紮,真就深深地埋下了根。

進入計算機系後,亓超非常努力,瘋狂地汲取每一個知識點和細節。逐漸,他的作業成了同學效仿的模板,即使是院系競賽也能屢屢拔得頭籌。慢慢地,他愛上了計算機。

2004年,亓超在遼寧科技大學讀碩士時接觸到了NLP(自然語言處理)領域。當時,他做了一個有關句法分析系統的課題,跟著導師去NLP基地實習;2007年,他碩士畢業,進入佳能語音團隊做基礎NLP工作,正式邁開了職業生涯的第一步——彼時的NLP領域跟現在相比算是無人問津的冷門行業,但亓超卻抱著對它十分的熱愛,從未氣餒過。

「確實是非常喜歡,根本沒有考慮過額外的方向。」

一步一個腳印走過,之後的亓超相繼被阿里、騰訊、微軟、百度聘請,成為了少有的BAT+微軟通關的工程師。

不得不說,「小冰」的開創是亓超生命中的一個重要節點。談到「微軟小冰」時,亓超的目光閃出溫情。

「產品可能做著做著,和人就分不開了。」彼時,原本亓超在自己的崗位上做得順風順水,突然有一天,老闆對他下達了關於「小冰」的任務:做開放域聊天的機器人。

當時市面上只有一款蘋果智能語音助手Siri,可以向蘋果用戶提供信息,但開放域聊天的伴侶機器人可以說是史無前例,沒有任何經驗可以借鑒,太難了。

亓超一下就懵了,這個東西沒接觸過,怎麼做?時間緊、壓力大、沒人、沒積累,旁人避之不及時,亓超接下了這個燙手山芋,並帶著團隊硬著頭皮往上沖。

「一般我不會在第一次就Say No,我會先做再去說,理清自己的思路之後,去更好的判斷到底能不能做、能做到什麼程度。」

這個從不Say No的工程師願意去挑戰,願意去相信一切無限的可能。就這樣,他摸著石頭過河,帶領著團隊開創了國內第一個人工智慧伴侶虛擬機器人——「微軟小冰」。

「有的時候會開玩笑地和別人講,我看的語料,比很多人看的書都要多。」亓超笑言。

亓超相信,做一個產品,首先你自己要變成一個產品。在做「小冰」的過程中,每一次小冰的回復他都能清晰地知道它的來源,甚至不用看都能夠猜到,它的回復是什麼,又是基於什麼樣的原因產生出這樣的回復。

小冰面世之後,引起了市場的熱議,微博上每隔一個時段,就會誕生一批最新的使用反饋。亓超守在電腦前不斷刷新微博,不願放過每一個網友對小冰的評價。

這個伴侶機器人對亓超來講,就像自己的孩子。產品初期反饋較差,團隊在不斷摸索的過程中,發現問題——研究問題——改進問題,這些步驟反覆輪迴。看到小冰一步步朝著正方向往前走,亓超得到的是異常的開心和滿足。目睹自己養育的小孩一點點成長了起來,這是他最大的收穫。

隨後,亓超被百度聘請做「度秘」這款任務驅動的多輪對話產品。由於百度希望度秘打通百度糯米、百度外賣一條線,因此當時的度秘定位更加註重O2O。你可以詢問它附近有哪些好吃的餐廳,也可以讓它回答你近期熱映了哪些電影。相比於小冰,度秘的情感性更少,目的性更強。

在經過兩次深厚的經驗積累後,亓超對於整個行業和專業都有了更進一步的認識。開始做三角獸之後,他終於不再用單個產品的形式來做NLP,而是站在技術提供方的角度幫助更多產品達成不同的使命。

作為一家to B公司,三角獸還將在春節前後推出SDK介面與API介面。三角獸希望跟合作方不斷溝通,將其打磨的盡量完美,去除排它的功能從而推給非標杆用戶,使得非標杆用戶通過利用三角獸的SDK介面和API介面,快速具備NLP的能力。

對於亓超來講,通過現在的工作方式能夠使得NLP技術的運用更為廣泛,也能讓他收穫更多的成就感。

虐心的快樂

工作之外,亓超有一個令人羨慕的家庭。

溫柔嫻熟的妻子和一個四歲的兒子是他工作的動力來源之一。不論工作再忙,他都會抽時間與兒子進行「男人+男孩」式的對決遊戲,周末陪妻子去影院看一場電影。

提到妻子,亓超舉手投足之間全是溫情。「快二十年了,遇到她之前甚至想都沒想過,能有這麼單純的人。這都是電視劇里才會出現的呀。」多年積累的默契,使得妻子對亓超的創業極大的支持。無論是原來在大企業帶團隊,亦或是現在的創業,亓超一直都戰鬥在一線。「上午十點左右到達公司,晚上一兩點回家。」但是善解人意的妻子對此並不多言。

得到了家裡的認可,亓超在創業中能夠沒有後顧之憂的施展拳腳,也更具理性的耐心。

「很多人在看了《她》之後都對人工智慧寄予了美好的期盼,希望它們能給人帶來心靈上的溫暖和慰藉。這正是三角獸在做的這個事情,但目前還只是相對比較初期的一個階段,它是一個逐漸成熟的過程,後期空間是很大的。」

「每一個產品都像是自己的孩子,為什麼你這道題還不會?養育孩子的過程中,我感覺虐心,但虐心也快樂著。」在一次次「虐心」中,三角獸的產品愈發成熟智能起來。

亓超認為,人工智慧技術的真正落地在產品中,而不是只用於描繪未來。他將帶領三角獸懷揣著萬一可以改變世界的小小情懷,將人工智慧技術的邊界向前推進。


推薦閱讀:

TAG:人工智慧 | 歧義 | 超分辨 |