搜狗王硯峰:只有大公司能做入口級產品,用戶規模直接影響研發實力 | 愛分析訪談
撰寫 | 李喆
摘要:王硯峰表示,在語音識別領域,搜狗是以C端產品為核心目標,做2B市場是為了積累行業經驗,尋找合適場景。現有產品用戶規模會直接影響企業的技術研發能力。王硯峰認為,只有大公司才能做入口級產品,創業公司還是應該考慮垂直類應用。
語音識別一直是人工智慧領域的大賽道,是商業化落地進程最快的領域。
近年,在加持深度學習技術後,語音識別率大幅提升,由此帶動了一波產業熱潮。作為一項通用技術,除了科大訊飛、捷通華聲等老牌廠商,以及思必馳、雲知聲、出門問問等創業公司外,語音識別還是大型互聯網公司發力的方向。
搜狗就是其中的佼佼者之一。
作為一家靠輸入法產品崛起的公司,搜狗在語音識別領域的布局水到渠成。基於輸入法積累的數據,使得搜狗的語音識別技術很快成為行業第一梯隊,尋找適合的技術輸出場景是當前要務。
不同於科大訊飛等2B廠商,搜狗是2C業務起家,在語音識別領域也依然圍繞著做出一款適合C端用戶的產品為核心去開展業務。限於AI技術在C端爆發要落後於B端,搜狗同樣在服務車載、家居領域的B端用戶,希望積累行業經驗後,開發出一款適合個人用戶的產品。
近期,愛分析對搜狗語音交互技術中心總經理王硯峰進行訪談,他分享了搜狗在語音識別領域的業務布局與未來戰略,以及他對語音識別領域行業現狀、未來趨勢的看法,現將精彩內容分享如下。
語音助手還處於市場教育階段
愛分析:搜狗2012年涉足語音識別,當時是出於哪些考慮?
王硯峰:搜狗的核心產品是搜狗輸入法,而語音輸入又是輸入法未來一個很重要的形式。2012年,我們判斷到這個趨勢,那時谷歌上線語音輸入,百度也已經開始研發語音技術。所以,對我們而言,輸入法場景下的語音識別就是我們需要全力拿下的。
愛分析:當時業內語音輸入識別技術是什麼水平?
王硯峰:都是基於更傳統的技術,整個語音圈子也不像現在這麼活躍。
愛分析:當時有語音識別的應用嗎?還只是停留在探索、打磨技術的階段?
王硯峰:已經開始在輸入法上線,還有車載產品里會有語音識別功能,只不過都做得特別簡單,以命令式為主。
愛分析:2013年開始推語音助手,當時市場什麼樣?
王硯峰:整體背景還是受到蘋果siri的影響,2012年siri推出不久,國內有一些小公司先快速跟進,比如智能360、出門問問等,在大公司里,搜狗推得比較早,從立項到推出產品,花了不到半年。這得益於搜索在用戶查詢以及服務方面的積累。
愛分析:現在來看,語音助手應用存在哪些問題?
王硯峰:手機上的語音助手解決不了用戶的實際問題,或者說痛點。在美國語音助手的使用率相對高一些,從查天氣、聽音樂到調起手機服務,確實跟文化有關係 。中國這方面整體上更實用更傳統,打動用戶一定需要去解決用戶的痛點才行。
愛分析:在智能汽車或者智能家居領域,是不是還有機會?
王硯峰:對,因為場景下有痛點,場景跟技術結合起來也能給用戶帶來真正的價值。
當然,我們覺得不排除語音助手在手機上會重新火起來,但要在這個基礎上去做到進一步進化,我覺得當更多的用戶培養起這種交互習慣以後,會玩出更多花樣。
目前來看,語音助手還是停留在市場教育階段。
做2B是為了做出好的2C產品
愛分析:在其他領域,是如何選擇場景的?
王硯峰:做AI會有兩種思路,第一種是你手上有一個鎚子,於是你看見什麼東西都像釘子,就想去砸一下;還有一種就是先考慮解決什麼問題,回歸到做產品的思路。先找用戶有什麼痛點,然後再思考我們有什麼機會,如何與技術結合。
愛分析: 現在有哪些好的場景?
王硯峰:大思路上,我們還是希望能夠去做有流量的產品,小而美的產品適合創業公司去做。
我們分兩個維度去看:第一個就是在什麼環境下,語音識別會更有價值,其實就是在不適合用觸摸式或鍵盤式交互的環境。
此外,我們也在考慮什麼用戶群體痛點比較多,並且比較有價值和長遠的想像力。
愛分析:這主要是2C領域,2B市場是如何考慮的?
王硯峰:2B是按照行業去看,2C是按照用戶去看。搜狗本質是做用戶產品的公司,我們做2B產品的過程中,希望能夠通過行業積累,後面孵化出一些好的2C產品。
愛分析:所以做2B業務出於策略考慮,因為C端短時間很難爆發?
王硯峰:以車載來例,前期我們以軟體的形態進去,不停打磨體驗,以及積累對用戶痛點的理解,包括用戶在導航上的消費方式。
如果是一個完整的硬體導航產品,那軟硬兩條腿都要走的特別好。如果連我們擅長的軟體都做不好,不能帶來競爭力,那麼一旦踏入硬體市場,你就更增加了一重失敗的幾率。
愛分析:從市場上看,2B業務是通用技術的應用,所以對於一些創業公司來講,是商業化的問題,搜狗是如何考慮的?
王硯峰:我們會先追求覆蓋率,然後希望品牌、產品能夠在這個市場上有比較大的影響力。這並不代表我們不考慮商業化,而是看當前行業最適合什麼樣的商業化模式。
現有用戶規模直接影響技術實力
愛分析:搜狗在這個偏通用技術領域裡的主要競爭力是什麼?
王硯峰:語音識別和對話交互。
語音識別的話,我們有輸入法的能力,有大量的數據去做訓練。
對話交互方面,因為我們有搜索以及一些內容服務,從技術積累以及服務接入方面,都會比純粹的技術公司要具有優勢。
愛分析:搜狗語音輸入法的語音日頻輸入次、語音識別率表現如何?
王硯峰:每天語音請求量是2.4億次,人均10多次。識別率方面,搜狗和訊飛不相上下,差距基本上是在0.1-0.2%之間,是正常範圍內的波動。
愛分析:現在影響語音識別準確率的因素有哪些?
王硯峰:數據與技術。
愛分析:技術層面,有沒有跟一些創業公司合作?
王硯峰:很難,從語音識別技術來看,創業公司跟大公司已經沒法競爭了。當你需要不停的去追求技術制高點的時候,需要投入大量的研發人員大量燒錢,而當公司具有生存壓力時,很難在新技術跟進投入太多人力。
愛分析:除了人員,還有哪些方面能夠判斷不同公司研發能力的差異?
王硯峰:我覺得公司旗下產品的用戶規模也是吸引人才加入的重要因素,大家都希望自己做出的技術被盡量多的人使用。
其次,擁有巨大用戶量的產品也能夠產生大量的數據,這也是比較重要的部分。
所以,這些因素是衡量一個人工智慧公司在未來發展前景的指標,我覺得就是數據、用戶場景、人本身的基礎能力。
愛分析:各家公司在識別率的差距是不斷擴大還是保持不變?
王硯峰:我們跟科大訊飛是基本持平,其他公司要差一些。小一點的公司甚至是在掉隊。
愛分析: 這方面的研發投入是在持續提升么?
王硯峰:一直在提升,研發投入在增長,每年整體是上億的投入,包含機器、人員和數據成本。
愛分析:數據標記是人工實現還是機器?
王硯峰:語音方面還沒有做到機器實現,主要通過人工。這也是制約人工智慧數據層面的重要因素。
愛分析:這部分主要是自己做還是外包?
王硯峰:主要是外包。
重點布局智能家居、車載,不考慮智能客服
愛分析: 智能家居領域,主要合作廠商是哪些?
王硯峰:小米電視、創維電視、魅族電視等偏互聯網的電視公司,目前的合作對象更多是黑電,把語音和搜索結合起來,在語音的基礎上能夠產生更多價值的,這是我們的合作方向。
愛分析:硬體廠商也有比較大的流量入口,之後會不會選擇自己做?
王硯峰: 會的。
在國內,技術服務商是沒有前途的,最終還是通過技術轉化為產品,繼續往上遊走。科大訊飛已經開始走這條路,在車載領域出了自己的智能車機系統。
上游公司有大量的設備和用戶,希望基於此來構建自己的語音能力,這個make sense。最終做出來的技術,哪怕不如搜狗的強,但是如果放在自己產品的垂直場景中,可能實用性也就夠了。
反之,市面上也有很多不錯的硬體公司,搜狗也可以去投資收購,搜狗也有自己不錯的硬體產品團隊,也有糖貓這樣優秀的硬體產品。在藍海中去和現有的硬體廠商競爭也是存在機會的。
愛分析:車載領域從後視鏡延伸到整個中控系統,現在來看,之前碰到的那些噪音問題有沒有解決掉?
王硯峰:有兩種解決方法。後端將這些雜訊加到模型裡面,讓模型本身更適應雜訊環境;前端是採取去噪晶元等硬體。
愛分析:家電、車載領域,搜狗是如何收費的?主要是技術收費還是有別的合作形式?
王硯峰:兩種方式都可以,一方面是通過 license計費,尤其是在一些更傳統廠商會更接受這種方式,這是穩定的服務保證。
另外,我們也在追求怎麼能夠通過廣告等後付費的方式變現,互聯網的玩法是去抓用戶,只要用戶在自己手上,總有一天能夠想辦法把這個價值榨取出來。
愛分析:現在license收費方式的議價能力高嗎?
王硯峰:溢價能力取決於技術壁壘,以及技術的獨有性。所以長久來看如果做不到這一點,一定是走低的。
愛分析:車載領域主要是2B的,合作對象、客戶主要是哪些?
王硯峰:主要是後裝的方案商、前裝的車廠。
愛分析:所以說車載這個領域會逐漸延伸到產品端嗎?
王硯峰:其實在後裝我們給出來的就是產品,不是SDK。
愛分析:數據層面的話,因為輸入法會貢獻大量的數據。在智能家居和車載這兩個環境的數據,主要是通過哪些渠道拿到?
王硯峰:合作夥伴。
愛分析:需要合作夥伴,是有很長時間的數據積累嗎?
王硯峰:不需要原來的積累,只要上線跑上一個月,就會有很多的用戶數據。
愛分析: 智能客服這個領域有布局?
王硯峰:目前沒有做。
愛分析:為什麼沒有考慮這個領域?
王硯峰:客服這個場景太2B了,沒法去轉換自己2C產品。這種太2B的業務還沒有大量投入去做,跟我們公司偏2C的基因有關係,我們去做車載、智能家居,也是因為最終還是可以2C的。
入口級平台產品只有大公司能做,靈活性與智能性不可兼得
愛分析:從整個語音市場來看,創業公司的機會點可能在哪?
王硯峰:創業公司不應該跟大公司在主賽道上競爭,一定要去做不一樣的事。
移動互聯網已經沒有太多機會了,後面不管是消費升級也好,產業升級也好,都有大量的AI能力需求,能夠幫助產業提升效率。
大家都在提AI、都在提入口,然而真的能夠做到入口的只有大公司。小公司要結合一些更確切的場景,去解決實際問題,而且這種問題也是目前大公司們覺得不適合自己做或者沒有餘力去做的東西。
愛分析:大公司還是往通用技術的方面去考慮嗎?
王硯峰:通用技術必須要做好,在通用的基礎上要有自己的產品追求。我們希望能夠在自己最核心點上,把產品價值、垂直價值做起來。
愛分析:通用類技術和垂直類技術,側重點有哪些差異?
王硯峰:通用是奔著平台去做的,通用你一定要考慮他的靈活性,靈活性意味著犧牲智能性。靈活性高,同時有一個大的分發平台、流量平台,更多的服務商才願意接進來。這樣小的設備公司才願意把平台放到自己的設備上去。它其實是一個正向性的循環。
垂直類考慮的是怎麼在垂直的領域下做更好的定製,更好地理解用戶的需求,怎麼能夠帶動垂直商去做一個更好的閉環,其實是兩個方向。
愛分析:這兩條路徑哪條可能會佔據一個更主要的地位呢?
王硯峰:最終我覺得可能會融合,或者部分融合。通用可能只是做一個平台,提供標準能力。在垂直領域,服務商可以基於這種能力進行二次開發。
在車載領域,我不會用屏幕進行太多操作,反倒是去實現足夠好的智能性,所以在這樣的領域,垂直類技術是一個更有效的方式。
愛分析:現在看搜狗整體的基因,基於技術的工具屬性很強,其實工具做成平台類的難度會很大?
王硯峰:搜索引擎和輸入法是公司現在最大的流量入口。
輸入法現在正在做的一件事,在聊天工具中,用戶可以通過輸入法直接獲取到用戶想分享給對方的內容,直接分享,而不需要再跳到對應APP中,智能分享功能剛一上線,就獲得了大幾千萬的流量,這是在沒有任何推廣以及用戶教育的基礎上得到的數字。
愛分析:所以後端還是需要很強的內容供應。
王硯峰:可以跟搜索打通的。
愛分析:內容供應是通過搜索去解決,還是直接通過這些不同場景的內容提供商?
王硯峰:都有,因為在搜索引擎上搜索到的也是內容提供商。同時,搜狗瀏覽器的網址導航有巨大的分發能力,有大量的垂直類型的客戶,它跟搜索是並行的兩個體系,都可以作為輸入法的出口。
愛分析:中美在人工智慧領域,特別是在語音識別方面還有什麼差異?
王硯峰:中國的產品能力是不比美國差,從技術領先性上,美國還是跑的更靠前。
其次,美國有一個很成熟的2B市場,這也是Nuance發展比較好的原因。在中國,不可能有Nuance這樣的公司。
因此,我反倒覺得美國的創業環境要好於中國。
愛分析:這個環境好主要是指企業付費意願更強么?
王硯峰:市場整體更成熟,美國對於專利、創新保護更好,中國不具備這個條件。因此,中國廠商更多會趨同,而美國會更多去創新。
關注愛分析訂閱號(ifenxicom),回復「 搜狗」即可獲得完整版報告。
「析議」是愛分析旗下的線下活動品牌,我們的口號是「析議辦的好,賽道任我跑」、「析議不要停,行業任我行」、「跟著析議走,熱點全都有」。
本期主題「 財富管理新篇章」,我們邀請了盈泰財富雲總裁楊勇、真融寶CEO李強、璇璣CEO鄭毓棟和老虎證券合伙人方磊,一起探討財富管理行業的新變化,挖掘行業新機會和新趨勢。
→傳送門
推薦閱讀:
※魏則西事件對中國搜索引擎行業產生了怎樣的影響?
※搜狗IPO在即:繼「三級火箭」後,AI將成下一個突圍關鍵
※從搜狗的語音技術發展史中,我們來看平台技術是如何落地的
※搜狗IPO是否會破發?趣店、唯品會、迅雷是不錯的參考
※為什麼北京語言大學的外國學生喜歡用搜狗作為搜索引擎?