特寫 | 解密阿里雲 ET:在人工智慧領域,「阿里巴巴在業務上是全球第一」
文丨龜途慢慢
當時鐘剛剛駛入 2016 年 4 月 9 日的時候,《我是歌手》第四季總決賽在湖南衛視落下帷幕,賽前被廣泛看好的 CoCo 李玟奪得了總冠軍。但當天,我們在記住了李玟的歌聲以外,還被另一個意外出現的事件所吸引,那就是阿里雲小 Ai。
賽前,高曉松等人就放出了有關阿里雲小 Ai 的預熱,稱其有很大幾率預測到最後的冠軍。即使「黑幕說」不可避免,但這個點還是成為了當天晚上除比賽之外的一個關鍵詞。
「其實這個事當時是一個偶然,當時大家都覺得挑戰非常大。第一,電視直播你錯了就錯,出醜就大了;第二,這個事情本身是非常難的,因為像音樂鑒賞這個事兒本身就沒有客觀標準,是非常主觀的行為,沒有標尺可選」,這個項目的負責人閔萬里說道。
事實似乎也證明了他的說法,在賽前,它給出的預測結果宣稱韓國歌手黃致列將會奪冠,這與最後的結果並不相符。不過還好,隨著比賽的激烈進行,各種數據和信息都在發生著變化,在第一輪淘汰之後的幾次預測中,阿里雲小 Ai 都表現出了比較精準的結果,並且在最終的三選一中成功預測到了李玟的奪冠。
在賽前的發布會上,閔萬里表示,小 Ai 是阿里雲研發的人工智慧程序,主要基於神經網路、社會計算(social computing)、情緒感知等原理工作。
做別人不想做、不敢做的事
閔萬里現在是阿里雲大數據孵化器團隊的負責人。在《我是歌手》節目之後,他又帶著阿里雲小 Ai 的升級版——阿里雲 ET——在雙十一晚會上協助馬雲變了一場魔術。
在閔萬里看來,通過在這種電視節目上的亮相,老百姓能真正感受到什麼是「人工智慧」。
(雙十一晚會變魔術)
不過,事實上,人工智慧上電視早已不是一件新鮮事了。早在 6 年以前,由 IBM 公司開發的人工智慧程序 Watson 就在美國當紅的電視問答節目《危險邊緣》(Jeopardy!)中戰勝了人類冠軍,一舉成名。而 6 年之後,以「人工智慧」為核心戰略的百度和搜狗又在重複著相似的工作。
即使面對著記者,閔萬里在談及競爭對手時也幾乎沒有諱言。這位本身就出自 IBM 公司的科學家表示對百度和搜狗的比賽結果「無所謂」,因為「它哪怕全勝,他也是在重複 Watson 的故事」。
而他要做的是「從零到一的事情」,「我要證明的是別人沒有做過的,或者別人不想做、不敢做的事。」
(阿里雲大數據孵化器團隊的負責人閔萬里)
閔萬里的團隊目前的主要工作是在雲上面做一些大數據的應用解決方案,並孵化一些創新的案例。預測《我是歌手》的冠軍當然很吸睛,不過只是一次小的嘗試,投入更大、意義更大、受重視程度更高的項目還要屬目前在杭州試水的「城市大腦」項目。
去年 9 月,「杭州城市大腦」的交通模塊已經在蕭山區市心路投入使用,試驗數據顯示:通過智能調節紅綠燈,道路車輛通行速度平均提升了 3% 至 5%,在部分路段有 11% 的提升。
據杭州政府透露,阿里雲 ET 人工智慧技術將為城市大腦提供內核支持,採用飛天操作系統,將百萬級的伺服器連成一台超級計算機,可對整個城市進行全局實時分析,自動調配公共資源。
(杭州城市大腦項目正式發布的現場)
事實上,在過去的 10 年中,所謂的「智慧城市」概念已經被大大小小的企業炒作過很多次了,但卻沒有哪座城市真正體驗到了「智慧」的感覺。在閔萬里看來,其原因就在於「單兵種太多,各個家都有機房,都有數據中心、信息中心,但這些東西最後都沒有打通」。而解決問題的關鍵就需要有一個信息貫穿的大腦。
而由於自己之前有過很多相關的成功經驗,比如在廣州市通過互聯網數據調控交通燈,阿里覺得自己可以做這件事。
當然,給他們這種信心的不僅僅是過往的經驗,還有背後強大的技術支撐。其中計算機視覺部分「城市之眼」就提供了很大的作用,負責這個團隊的則是圖像領域的專家華先勝。通過對各種圖像及視頻數據進行深入分析,他們能幫助整座城市做進一步的決策。
「從場景當中長出來的」
閔萬里和華先勝的經歷頗有些相似的地方。
2013 年 9 月,當時還在矽谷的閔萬里回到了杭州,加入了阿里巴巴集團。在此之前,他先後在 IBM Watson 研究所和 Google 從事人工智慧方面的研究工作。
而華先勝則稍晚一步。2015 年年初,因為阿里的邀請,華先勝從西雅圖回到了國內,加入了阿里巴巴。此前,他已經在微軟工作了 14 年。目前他則是阿里雲視覺計算團隊的負責人。
(阿里雲視覺計算團隊的負責人華先勝)
事實上,大概從 2013 年開始,阿里巴巴陸續從世界各大頂尖團隊挖來了多位世界級人工智慧專家,美國密歇根州立大學終身教授金榕,麻省理工學院博士、普渡大學終身教授漆遠都是在那段時間從美歸來,加入了阿里。
那時,「人工智慧」作為一個學術名詞還停留在很多學術機構和大公司的實驗室中,工業界還遠未像今天這般重視這個技術領域。在國內,百度毫無疑問是最早的布局者。2013 年年初,百度就成立了百度深度學習研究院(Institute of Deep Learning,IDL),並在三個月之後在矽谷成立了矽谷人工智慧實驗室。
雖然沒有百度那樣早的戰略布局,但阿里也已經在一些專業領域——比如電商部門——開始了人工智慧方面的研究。閔萬里剛剛加入阿里的時候就是在電商部門做數據挖掘的相關工作,而華先勝則負責淘寶「拍立淘」的開發任務。
(手機淘寶中的拍立淘)
早他們二者一步進入阿里的初敏對這個過程有著更完整的了解,在這位在 2009 年就追隨王堅博士的腳步進入阿里的智能語音技術專家看來,阿里作為一家以電商立足的公司,「接地氣」就是他們做人工智慧最大的特點。在這裡,「接地氣」的意思就是「從下面的基礎業務部門開始推動」。
「一開始是業務部門感受到了這個趨勢,然後小的業務部門就開始說我需要這個技術。可能最開始是從外面採購,後來才慢慢發現這個不對,這麼重要的技術是應該我們自己要做的,然後就開始自己做。」
閔萬里則用「從場景當中長出來的」來總結阿里巴巴人工智慧技術的發展史,此言不虛。而他也認為這可能也是阿里巴巴和其他公司的主要區別之一。
從一個個獨立場景到阿里雲
「我能想像到最好的使用場景(圖片搜索)就是電商。我認為拍照購物這個場景是很有道理的,因為我經常看到一些東西,可能我不好描述。比如我很喜歡你這個背心,那我怎麼描述它,這個不好描述,但是我拍張照片就好了。」
因為自己的這個理念,華先勝離開了微軟來到了全世界最大的電商平台阿里巴巴,並且在一開始並沒有加入阿里雲團隊,而是進入了電商團隊的搜索事業部。在那裡,他主要負責的項目就是淘寶 App 中的「拍立淘」功能。
「拍立淘」可以讓用戶通過拍照的方式實現「以圖搜圖」,以此來解決用戶在不知道商品名稱的情況下購買的問題。在此之前,淘寶其實已經有這個產品了,但是離用戶的期望還差得很遠。其中如何處理淘寶賣家們千奇百怪的圖片就是一道難題,「你知道有的賣家的商品圖片都是像牛皮癬一樣,上來貼滿了狗皮膏藥。」
而華先勝通過一年多的工作讓這項功能有了很大的提高,他把每張圖片變成幾千個數字,用這幾千個數字代表某件商品的特點,比如一件襯衣是長袖還是短袖,什麼樣的領子,有哪幾個顏色。「這幾千個數字就要把它描述出來,雖然人眼看不出來。但是這幾千個數字就反映了它的本質特徵,這都是人工智慧的技術在裡面。」到了 2015 年雙十一當日,拍立淘的使用量超過千萬。
但這時,雲計算的大潮已經興起,阿里也早早將其當作了自己的又一個核心發展方向。於是,因為公司的需要,華先勝離開了電商部門,加入了阿里雲。
初敏的經歷也證明了這不是一個個例。這位語音專家在加入阿里的前幾年做過各種和數據有關的事,其中包括了翻譯、輸入法、淘寶搜索、阿里搜索等等,「最終回到這個行業是 2014 年下半年了。」
(阿里雲 iDST 技術總監、阿里雲語音團隊負責人初敏)
從 2014 年下半年開始,阿里開始在阿里雲的體系下進行人工智慧方面的綜合性研究。
考慮到人工智慧所需的兩大方面:強大的計算能力以及廣泛的應用場景。這個戰略決定從技術的角度來看似乎再合理不過了。
- 首先,人工智慧的基礎就是演算法和數據,如果沒有足夠強大的計算能力,計算機沒有辦法變聰明,而這恰恰是阿里雲的長處。從 2008 年開始,阿里雲在王堅博士的帶領下開發了強大的飛天系統,這套系統目前有 100 萬個 CPU 的核,有 60 萬塊硬碟,相當於一個 EB 的存儲能力。
- 第二點,作為屬於未來的底層基本技術,人工智慧的應用場景一定不僅限於電商領域,而這就需要阿里雲發揮作用了。「因為阿里雲服務的就是外面很多行業,所以從這點來講,你看到行業的訴求和痛點的時候,你就有可能綻放出一個好的解決方案,把人工智慧技術用起來,發現了成功案例就去宣傳。
目前,阿里雲在自己的平台上開放了多個相關的 API,比如人臉識別、智能語音交互等等。外部的創業公司可以通過使用阿里雲的服務免去自己開發的相關步驟,而他們在使用過程中產生的數據經過迴流還可以讓阿里雲 ET 變得更聰明,「這其實是個雙贏的事情。」
(阿里雲官網上發布的部分 API 服務)
將人工智慧與「雲」結合起來的戰略還體現在雲 OS 操作系統上。目前,據初敏透露,阿里雲智能語音團隊很大的一塊工作就是跟雲 OS 進行深度合作,因為「雲 OS 的操作系統是支持多端的,這裡面雲能力也是需要多端的,而且應該是多端打通的」。
不過,在採訪中,阿里雲的相關工作人員也表示「人工智慧」在阿里內部的地位未來還會再提高。雖然截至本文發表當天還沒有確切的相關消息,但就在不久之前的阿里巴巴集團首屆技術大會上,馬雲宣布將建立阿里巴巴的『NASA』,「面向機器學習、晶元、IoT、操作系統、生物識別這些核心技術組建嶄新的團隊,建立新的機制和方法。」
但無論未來人工智慧被阿里提到哪一個層級,阿里雲都會是其中重要的一環。
要做平台
「蘋果會說自己在人工智慧行業是『second to none』,你們會怎麼評價自己?」
「其實從技術上來講,各家都有特色,或者說側重點不一樣。但是從人工智慧在業務領域、垂直行業的創新上來說,我覺得阿里巴巴現在應該走在全球的最前面。」閔萬里說道。
因為自己帶領的既是一個技術團隊,同時還是一個業務落地的團隊,所以閔萬里需要承擔商業方面的 KPI 指標,但這也讓他和阿里雲人工智慧的落地情況有了更深的了解。他同時認為,阿里和其他公司在人工智慧方面的最大差別就是「對技術和業務場景的深刻理解和抽象提煉」,但這並不表示阿里需要把所有的場景都自己做掉。
「我們要在某些垂直行業當中找到 1 到 2 個創新的案例,我們要證明這些能力加上正確的方法,能夠在這個行業產生價值,後面才會有更多的公司願意跟著我們一起在這個行業當中深挖,把另外的一些痛點給解了,這樣我們就把這個生態給做起來了。」
承接各個場景,這種對業務領域的廣泛布局成為了阿里的優勢,也自然而然變成了他們未來的長遠目標。
「建立雲上視覺計算的生態」——這是華先勝心目中的長遠目標。在他看來,廣義的 AI 也可以平台化、生態化,這樣「大家都可以在 AI 的平台上去做研發、部署和生產」。
這聽起來很符合阿里的氣質和地位。在和幾位高級研究人員的對話中,他們都或多或少表露了類似的意見和想法。閔萬里也認為,將來的趨勢一定是一個「多鏈路、多種功能的結合」,一定是「多種技術結合成一個完整的解決方案去解客戶的問題」。
因此,「那些有特色的小而美的公司會成為這個生態當中非常重要的補充,或者是應該成為這個平台上的一個很好的玩家。」
「我們會去做底層的平台性的東西,然後他們在上面做各個方向的垂直。所以這些人我們認為都是我們的生態夥伴」,初敏也這樣認為。
最後,要找到技術的正確傳遞方式
一切的問題似乎都變成了「尋找正確的產品形態」。
當我們坐在阿里雲的辦公室里時,初敏為我們展示了支付寶中的語音入口,「幫我給 XX 轉 20 塊錢」,屏幕上出現了通訊錄中的那位聯繫人的名字,確認之後,不用點擊,20 塊錢就轉了過去。
這個過程看上去還不錯,而淘寶和天貓這些阿里系的 App 中的語音入口也大同小異。初敏把這種交互方式稱為「意圖的分發」,目的就是在複雜的多層任務中直接傳達意圖,只是「產品形態還沒有跟上」。
(支付寶中的語音助手功能)
當然,誰也不知道最終的產品形態會是怎樣。僅拿語音來說,初敏認為 Amazon Echo 的例子很成功,但不一定是最後的答案,「我是認為只要有一個總的入口就好了,這個東西來控制所有其他的東西」,初敏說道,「這個東西也許是手機,也許是家裡的音箱,或者也許就是你那個 Wi-Fi,因為每家都有一個 Wi-Fi 入口,也可能是你廚房裡那個冰箱,具體是什麼我覺得不好說。」
而華先勝則認為演算法、數據、用戶、平台、商業模式這 5 個要素是他心目中一個成功的人工智慧商業應用的必備要素。
在他看來,頂尖團隊在演算法上的差別會越來越小,大家比拼的是綜合的資源,你既要有演算法和數據,還需要訓練數據的能力,並且還需要通過正確的商業模式觸達到足夠多的用戶,以此才能真正成為一個成功的人工智慧商業應用。
閔萬里也覺得這是一個相輔相成的事情,你既要有技術,還需要對業務場景有足夠的了解。「應該這樣講,我們的人工智慧技術不是為了技術而技術,我們一定是一個全站式的解決方案,我們的技術上來之後就能解決客戶問題。」
在剛剛結束的阿里雲棲大會·深圳峰會上,阿里雲在人工智慧領域發布了 ET 醫療大腦及 ET 工業大腦這兩個新的垂直類項目,一個專註於醫療領域,另一個則負責工業生產方向。這似乎是阿里雲 ET 沿著這些思路所做的新嘗試。
(最新發布的 ET 醫療大腦)
「我們將 ET 醫療大腦設置為一個開放的人工智慧系統。除了阿里雲的人工智慧科學家投入到研發當中,我們更希望能吸收外部精良的演算法與醫學經驗,這樣 ET 才能更快地成長為一名高級醫師。」閔萬里說。
結語
2016 年 8 月 9 日,在阿里云云棲大會·北京峰會上,阿里雲總裁胡曉明說:「也許在 20 年後,管理阿里巴巴的,將是一位商業領袖 ET!」
「這樣的場景真會出現嗎?我們又該怎麼樣定義阿里?它會是一家雲計算公司,還是電商公司,還是人工智慧公司?」我把這個問題拋給了閔萬里。
「我覺得可能到後面,雲計算和電商都不需要再談了,因為它已經深入人心,無處不在了。但是『人工智慧』這個詞會熱很久,熱很久有好有壞,一方面它還一直不斷地在完善當中,另外一方面它能夠持續保持關注度,成為社會大家的一個共識,就像今天我們講互聯網,沒有人去挑戰。所以說,那個願景我覺得是有可能實現的,但是不是百分之百靠 ET 就是另外一回事了,」保持著他一貫的微笑,閔萬里回答道。
原文鏈接→特寫 | 解密阿里雲 ET:在人工智慧領域,「阿里巴巴在業務上是全球第一」
推薦閱讀:
※阿里不再有嘻哈
※特朗普對中國下黑手,先向誰開刀?
※反動技術權威馮大輝
※阿里巴巴曬出靚麗的Q1財報,竟然慘遭5億網友碾壓
※阿里量子通信開始商用 開啟數據絕對安全時代?