【新華社專題】雲知聲黃偉:AI熱終會冷,要跑的比任何風口快

風口不會隨便眷顧一個人。因為歷史不會對默默「打怪升級」著墨,它只看結果。

在阿西莫夫的代表作《基地》中,除了先知謝頓貫穿全線,其他主角都是門徒。他們內在為直覺所驅動,外在被時代所推動。他們在歷史上的出場毫無徵兆,卻在潮流中遊刃有餘。你會驚嘆,為什麼是他?

離開谷歌、微軟、IBM、Facebook、阿里、百度,告別自己過去的所有榮耀,重新走上創業之路,崇尚技術的護城河。為什麼是他?新華網開闢「出走的門徒」系列,講述這樣一群科技界理想主義者的現實路徑。

新華社上海2月4日電(記者周琳)2004年黃偉從中國科技大學畢業時,正好趕上第二次人工智慧浪潮臨近破滅的尾巴,卻同時又是語音識別行業第一個風口到來不久的時候。2005年,全球領先的語音識別公司Nuance上市,市值最高突破90億美元。3年後,黃偉所在公司的語音識別部門被Nuance收購。

這個本是實現計算機聽覺為強人工智慧服務的領域,卻在AI趨冷的時候大熱,更說明了技術的不可預見性。

近15年過去,這種戲劇化的變化再一次出現。儘管出現了AlphaGo橫掃圍棋界等標誌性事件,讓AI這一行業在2016年開始紅得發紫,儘管2016年老羅在發布會上show了一把計算機聽覺的精準性,亞馬遜的語音助手Echo Alexa銷量狂飆了三倍,我們卻已經很難得出,語音識別已經站在了AI創業風口浪尖這個結論。

當年和黃偉一起學習或共事的人,很多人都離開了這一行業。固守判斷、等待爆發是一件很考慮耐心和實力的事情。

誰也不知道下一個風口會什麼時候流行;技術也並非是唯一的護城河;但是,語音識別正確率的不斷提高,解放人類雙手是大勢所趨。這恐怕是黃偉在經歷過摩托羅拉、Nuance、盛大、創辦雲知聲之後,能最堅定的信念。

逆風反擊:AI領域「模仿者必死」

雲知聲於2012年成立,也是在那一年,Siri開始支持中文。

語音識別領域的廝殺在這些年顯得非常激烈。國外,谷歌、亞馬遜、微軟都通過技術積累和收購初創公司,殺入戰局;國內,百度憑藉著在AI領域的提前布局獨自拼奪,和黃偉師出同門的科大訊飛更是成立十多年,屬於行業當之無愧的老大。

2012年前後,正處在AI第三次興起的交替期。那時候,科大訊飛還沒有成為網紅、AlphaGo還沒有驚艷亮相,市場對人工智慧最火熱的討論仍然來自於科幻電影。

後發卻想要先至,信心是最重要的催化劑。在那時,極少有創業公司敢把所有身家賭在「深度學習」這件事情上。

雲知聲做的第一件事,就是把深度學習應用到了語音識別里,而且把它開放出來提供給了第三方。

2012年9月,雲知聲發布了基於傳統統計模型的第一代引擎,準確率上升到了85%,比當時的訊飛高出5個百分點。但想要再優化,就必須要有迅速獲得大量、免費的數據。於是,雲知聲開放了自己的平台,任何人、任何組織只要在平台上註冊,就可以免費使用公司的SDK(軟體開發工具包);在APP里接入這一SDK,就可以免費調用雲知聲的語音服務。

憑藉著免費這一法寶,到2013年底平台上接入的企業客戶數量達到接近一萬家。現在,企業客戶數達到了3萬家。快速的數據積累,讓雲知聲進行了一系列數據迭代和演算法優化,將識別的準確率提升到了97%。

但再好的技術,只有當它變成對用戶有價值的產品時,它才有商業價值。既便技術過硬,留給後來者的機會仍已不多了。

第二步到底應該怎麼走?做APP?流量的導入掌握在BAT手裡,你不可能再用那麼低的價格去實現基礎設施(用戶)的積累;做與科大訊飛雷同的業務?也很難從成熟的大公司手中去搶蛋糕吃,更何況在教育等領域,訊飛的優勢地位幾乎是無法撼動的。

「有行業第一,並不可怕。」黃偉意識到,任何一個公司,有它的沉澱,就有它的包袱。大公司受制於股權等因素,對很多新領域很難快速反映。必須找出一條和行業老大不一樣的路,而且向投資人證明這條路在商業上是可行的。

2012年底的很多科技新聞中都曾展望:蘋果會開發一種語音的方法解鎖pad,而非現有的按鍵。最後我們發現這一功能在家電上更早出現。「我們根據用戶場景倒推,未來用戶的形態應該是,比如,在客廳的沙發上,自然與空調對話,而不需要湊上去和它交流。」黃偉說。

隨後,在樂視TV上、美的空調、抽油煙機上,語音助手迅速落地。回過頭去看,其實只用了2年的時間,雲知聲就將自己的基礎語音識別引擎落地並步入正軌,再用數據反哺演算法,不斷將其客戶從家電拓展到醫療、汽車等其他領域。

對於黃偉而言,產品想要複製到任何需要文字錄入的行業,司法、傳媒等,就沒有太多不確定性了。「我們最後證明了:一,BAT之下確實還有別的路。二,行業老大之外這條路確實是可行的。」黃偉說。

順風快行:手機不會是語音識別「主戰場」

2014年,黃偉第一次提出了自己的「雲端芯」概念,將公司定位於「一個IoT(物聯網)時代的語音AI服務商」。為了做物聯網,雲知聲在2014年引入高通成為戰略投資方;同時進行內部架構的調整,成立了IoT事業部,占當時總人數的一半以上。在2016年AlphaGo還未火起來的2月,雲知聲又成立了AI Lab。

黃偉介紹,公司雲端芯的服務分三種:1)有晶元級技術,比如說冷喚醒和打斷等;2)有終端軟體的交互層面,比如開車時萬一網路不好,我們還有純離線的方案;3)還有一些複雜的請求走雲端。最後的解決方案是考慮了有網路、無網路等所有環境,並不是只賣一個晶元或者雲端 SDK 。

有了這樣的安排,晶元不僅可以收集信息,還可以承擔一部分智能的功能,解決基本的需求。

這看起來並不是技術的顛覆。然而對於一個創業公司而言,如何確定你的商業模式和產品模式,如何建造你自己的壁壘,恐怕是技術之外更重要的考量。

對於這些模式的確立,黃偉的思考模式值得探究。傳統而言,大家的思維模式是「做什麼」;而筆者接觸過的人中,有兩個人並不是這樣。一個是喜馬拉雅的余建軍,他的說法是「踩過了所有的坑才成功了」;另一個就是黃偉,他給人的感覺是「先考慮什麼堅決不能做」。這種歸納和排除的出發點,和旁人不同。

2012年-2014年,黃偉堅持的是「不做APP」。到了2014年確立了「雲端芯」戰略,他又有兩個排除:不能只做聯網方案、不能只做手機方案。

很早黃偉就認為,手機從來就不是語音識別的主戰場。你肯對著音箱、冰箱、馬桶、抽油煙機說話,即便這些用品沒有屏幕。但手機還是基於屏幕的,它更常用到的交互方式是「觸碰」而非聲音。

市面上很多在做智能家居的公司還是基於APP和手機的,例如將家電聯網,在用手機來控制操作。而橫掃歐美、被稱為亞馬遜「翻身之作」的Echo Alexa則是一個用音箱來連接的中控平台。

「智能家居人機交互的正確做法恐怕最後不會是APP。」黃偉說,它可能會是一個全新的增強設備,甚至最終取代手機。不過與亞馬遜從中控開始做的方法不同,雲知聲還是希望先從終端滲透率不斷增加著手,培育用戶的習慣。

作為語音助手,Alexa看起來似乎是所有語音識別公司的競爭對手。黃偉則認為並不是。

「亞馬遜肯定不是我們的競爭對手,合作機會是大於競爭的。」黃偉說,從智能層面,國外的雲服務商在國內落地是很難的,而在亞馬遜本土化的落地方案等方面,都是有合作機會的;在雲端服務上,很多技術都可以由雲知聲來提供。

一個成功的企業,始於技術,興於商業,卻久於管理。「當時間到了2016年時,AI公司還在講演算法、講評測,只會非常不成熟」。黃偉說,沒有純粹的AI公司。只有技術和行業結合,將技術、數據和商業閉環打通的公司,才是一個健康的公司。在人臉識別、雲服務等任何一個細分領域,最後都只會有少數幾家公司能勝出。

擺脫風口:技術並非唯一護城河

在《烏鎮指數:全球人工智慧發展報告(2016)》中,雲知聲以6000多萬美元的融資規模,排名在全球AI企業融資額榜單第19、中國第三(另外兩家分別是碳雲智能和出門問問)。

但即便融資了這麼多錢,此時你如果打開雲知聲的官方網站,卻依然很難體會出「藝術感」。文字放得很大,有的時候一個屏幕上只剩下了導航欄和標題圖;首頁可以拖動很長,畫了很多展示技術的概念圖,每張圖片連箭頭都需要橫平豎直。

這大概已經是理工男對藝術最佳的理解。

黃偉所畢業的中國科技大學,是國內知名的理工類學校,其最盛產的有三類人:理工男、穿著大褲衩的理工男以及穿著大褲衩、趿著黃拖鞋的理工男。在那裡,談戀愛略等於一起上自習;很厲害略等於可以一學期刷光全套吉米多維奇;優秀畢業論文略等於一篇Nature或Science。

然而,對技術的極致崇拜,有時候在商業上並不見得是優勢。在這個故事滿天飛的時代,你的巷子深了,資本還沒走到,就會醉倒在半路。曾經在一個科大創業類的群中,「技術和Pr哪個更重要」的話題,幾乎百分百都把票投給了前者。

時間回到2006年。彼時還在摩托羅拉語音識別部門的黃偉,為MOTO最具盛名的「明」系列手機開山之作A1200提供語音技術支持。如今你在百度中搜A1200,還有很多人人網的評測說,「教你怎麼語音打電話」。

在當時識別準確率還不高的情況下,願意去做這樣嘗試的人,簡直是在刀尖上舞蹈,這得對自己的技術多有信心。

作為純正的理工男,黃偉也曾有過「將技術作為唯一評價標準」的時代,但創業數年,他正在不斷修正自己的判斷。這種管理上的改變和平衡,並非是大學教他的,而是在盛大研究院管理期間體悟出來的。

從摩托羅拉語音識別部門被Nuance收編,到不願意只做本土化,前往盛大創辦研究院,再到自己創業,黃偉每一段經歷,似乎都在刻意補齊了技能樹上的短板:在摩托羅拉,潛心做了幾年的研發和演算法;在盛大,升級了自己管理的技能樹。

「不是說技術不重要,但如果別人技術98分、我96分,這2份的差距不足以決定商業上的生死;而如果其他方面別人做的很好,做到了80分,你只做到了60分,你必死啊。」黃偉說。

最後創業時,你的資源永遠是有限的,不可能每個崗位都招到最合適的人。能夠把不同價值觀、不同追求的人,集合在一起,將技術和管理結合,最後平衡、平衡、平衡,最重要的事情說三遍。

黃偉認為,技術在一個公司最終的比重只佔到20%。尤其在中國這個市場環境中,光有技術是不夠的,要補足很多其他的能力。單一人群創造力是有限的。無論是技術很牛的人,或者沒有好的教育背景,但對產品特別有感覺的人,都特別值得學習。

「過去我們在人工智慧領域耕耘,缺少經費和機會。於當時,我們是不幸。而今天人工智慧成為科技領域的新熱點,對於在人工智慧領域堅守多年的我們來說,我們又是如此幸運。」黃偉說。(完)

原文鏈接:

出走的門徒之五--雲知聲黃偉:AI熱終會冷,要跑的比任何風口快-新華網


推薦閱讀:

TAG:雲知聲 | 人工智慧 |