王小川要轉型人工智慧,到底是噱頭還是大勢所趨?


這並不是一個噱頭。

在人工智慧時代,搜索可以算得上是該技術落地的一個重要領域。另外,搜索需要的核心功能以及數據也為人工智慧的發展打下了基礎。因此,發展人工智慧成為了搜狗的一大重要方向。

對於搜狗來說,轉型人工智慧並不只是說說而已。

2017年10月,搜狗向紐交所遞交了招股說明書。在這份長達200頁的英文招股說明書中,搜狗總計90次提到了人工智慧(AI),9次提到自然語言處理,7次提到機器深度學習。由此可見,搜狗對發展人工智慧的態度並不是「說說而已」。

搜狗也表示:

站在AI研發的前沿,並且有明確的路線圖……重點關注自然交互和知識計算,在語音、圖像、機器翻譯、問答等方面有重大突破,並且已經成功融入搜狗的產品和服務中。

其實,早在2016年全年及四季度的財報解讀會上,王小川就曾表示:

「我們希望在搜索、輸入法、自然語言的計算、自然的交互這幾個場景里,大家都能看到搜狗的聲音,尤其硬體、IoT到來的時代,無處不在會有交互和機器智能,這是對未來的判斷。」

之後,搜狗推出多款搭載人工智慧技術的產品。其中,最亮眼的就是2017年2月登陸全新版《一站到底》的問答機器人——汪仔,該款產品展示了搜狗在自然交互和智能問答等方面的技術。

從搜狗的招股書可以看出,無論是在介紹自身的競爭優勢,還是在描繪未來的幾大發展戰略,人工智慧都起著舉足輕重的作用。


不是噱頭,搜狗北美國上市搜狗被如此看好,很大程度上是他的招股書中,所提到的近百次AI 內容不是停留在概念上的泛泛之談,而是從技術到產品落地,從戰略到未來發展規劃通通都涉及。

用王小川自己的話說:「語音翻譯成文字的下一步突破是對語言理解的本身。」

也就是說,AI不再是分析數據,而要開始聽懂我們的話並說出我們想說的話或者想聽的話。

不用覺得很可怕,任何技術的發明都是為了造福人類,但是被有心之人使用是另一回事,不能因噎廢食。

現在我們聊天的時候,有語音轉化成文字,已經覺得很方便神奇了你說實話我微信都懶得打字。另外根據上下文含義會自動生成快捷回復。

此外,有了搜狗特殊的內嵌的翻譯技術,我們在使用語音或者文字的時候,將會直接收到外文翻譯,就是說 出國你說自己想說的話,再也沒有語言障礙。

當然我最期待的是流行網紅事件中的段子轉化,這就很像很多美劇英劇的字幕組,你就相當於有了個私人機器字幕組給你翻譯,隨時隨地可以享受看美劇的樂趣。

另外,在搜狗的招股書中這樣說道:「站在 AI 研發的前沿,並且有明確的路線圖……重點關注自然交互和知識計算,在語音、圖像、機器翻譯、問答等方面有重大突破,並且已經成功融入搜狗的產品和服務中。」

王小川不是個買概念的人,如果是,他早上市了。


在今年上半年,我是鼓吹過AlphaGo這樣一場跨世紀的比賽。

7月16日,由極客公園舉辦的,2016奇點——創新者峰會在上海科技館舉辦。搜狗CEO王小川做了主題分享。Xtecher小編第一時間送上此次人工智慧演講的最全乾貨。

王小川本人是人工智慧的鼓吹者。在大家談互聯網的時候,搜狗就開始談產品;大家談產品的時候,他們就開始談技術;大家開始談技術的時候;他們已經開始談人工智慧。那今天大家都在談人工智慧,這次一些什麼東西呢?王小川認為搜索公司本身就在做人工智慧,對於搜索公司而言,人工智慧技術的引入不是顛覆新的市場,而是在原有的用戶需求裡面進行一個漸進性的改進。

在本次大會上,王小川的演講別出心裁,大屏幕的搜狗語音識別同步展示文字,講完速記就出來了,很戳萌點。下文就是此次實時速記的搶先內容。

口述|王小川 Xtecher記者整理

談人工智慧的時候,我會談一些反思。因為今天大家可能過多的高估了人工智慧的未來,在今年上半年,我是鼓吹AlphaGo這樣一場跨世紀的比賽。

語音識別仍有很多限制

在全球範圍內的投資異常活躍,在中國也一樣。在這個時候,我想談到「我們得小心,什麼地方是陷阱,什麼地方是真的人工智慧的未來」。在前一個月我去谷歌跟AlphaGo的工程師做了深度溝通。有什麼樣的演算法能夠改進贏得第四局的比賽?谷歌的工程師跟我苦笑。說:你講的方法我們都試過了。回到我們對於深度學習,今天大家知道它有巨大的危險。因為傳統做人工智慧的一些專家就在語言深度學習本身有它的缺點,穩定性不夠。在一些需要完全可靠的場景裡面,它沒有完整的數學的計算和證明。所以這種情況裡面,即便它是99%的正確性,也可能會帶來不確定。比如:在無人駕駛。這1%都不確定性,就可能帶來汽車的失速,而且我們還不知道怎麼修改。深度學習能夠做很多事情,但是到現在我們人類的技術掌握還是夠淺的。

我也談到在「語音識別」這樣的一個話題,今天語音識別已經到了比較高的準確度,已經接近實用。但是還有很多的限制。比如:我們需要安靜的環境。當有噪音的時候,如果同時有兩個人在說話,機器就搞不定了。我沒有辦法去去除噪音,比如:在汽車的環境裡面。我們會預先錄製有發動機引擎的聲音,或者是車窗玻璃的噪音把它加到我們的識別系統里去。就把沒有見過的這樣一個環境,變成機器能夠見過的環境就能夠做識別。但是我就跟工程師在聊,如果有兩個人說話怎麼辦呢?總有一個人的聲音是聽不見的。我們的解決方案是用麥克風矩陣,當有一種麥克風的時候能夠定向的做識別,如果兩個人不同的位置不同的聲音音源,就可以分離開。

今天的計算機離人還有巨大的距離

不要再抱怨什麼運氣不好,沒賺到錢,根本就不是靠運氣來的,要不是無意中加到 V的信: kdj624 號 在他教導下,我改變方法終於逐步有了盈利,我還以為股市是個大黑洞,不過現在不用懷疑了,杠杠的賺錢,嘻嘻,人是靠兩隻耳朵定聲音嗎?如果只有一隻耳朵,或者兩個人在同一個方向說話,會怎麼樣?人是能識別的。機器就做不到了。我也問了搞神經科學的人。他們會說,如果當有兩個人說話的時候,位置不一樣,人就能分離開。如果位置一樣,一個人聲音大,一個人聲音小,也能分開如果兩個人聲音一樣大,一個是男聲、一個是女聲,也能分開。如果都是男聲,但一個人說中文,一個人說英文,也能分開。所以人是在一個環境當中,只要能夠找到一線機會去把兩個聲音的不同能夠找到這樣一個特徵,就能動態的去分離。但是對不起,今天在全球範圍內,我們號稱在語音識別有重大的各種各樣的突破,還是解決不了這樣的問題。所以我們知道,今天的計算機離人還有巨大的距離。

除了一個技術本身的瓶頸以外,我們在創業當中,有很多領先的技術公司還會面臨什麼樣的瓶頸?很危險的,一種可能性就是有技術。帶著這種技術去找市場,比如:我們做了人臉識別,就開始想像人臉識別怎麼去使用,就去找市場的方向。但是很有可能在這個過程當中沒有找到,我們公司就死掉了。也有一種可能性是在找市場的過程當中,我們花了很多力氣去組建我們的銷售團隊。我們去嘗試跟各個領域去結合,但是這個時候,忘了技術的源頭。因為技術是不斷在迭代更新的,如果我們不能夠跟高效、跟前沿的技術保持同步,可能我們偶爾找到了一點市場,但是我們的技術一定變落後。

今天在中國的人工智慧領域裡面,做語音識別、圖象處理的公司有很多已經掉了這樣的一個陷井裡面去了。所以創業的道路裡面我跟投資人也在講,非常不容易,技術本身就沒有這麼靠譜。即便技術靠譜,可能沒有市場,即便有了市場,可能我的技術已經丟掉。像我們的做法,就是已經有廣大的市場,搜狗的輸入法、搜狗的搜索已經有千萬的用戶在使用。

人工智慧跟高校、學術界的聯動是比較多的,要不斷的跟技術的前沿保持同步。比如:李志飛一定會由他的工程師團隊讀論文甚至寫自己的論文,把這個前沿給跟上。人工智慧創業不像以前的互聯網創業一樣有一個模式就夠了,而是要不斷的把技術積攢起來。

搜索本身就是一種人工智慧

在這裡面也提到一個命題作文:我們怎麼討論「技術」跟「幸福」之間的關係?我做了一張簡圖,左邊是提的一些技術。包括:語音識別、人臉識別、人機交互、服務機器人等等,大家覺得這個詞跟幸福有關係嗎?在座大多數的人本身不是搞技術的,因為大家敬仰技術、崇拜技術,所以我們會過度的在技術裡面自己想像出它無限的光環。其實跟幸福沒關係,是因為我們的不理解、恐懼和嚮往帶來了一種誤解。

看右面。右面這些聽起來我就覺得比較酷了,自動駕駛、能聽懂我說話、診斷疾病、一鍵送咖啡。聽了怎麼樣?是不是有一些幸福感?左下角這個詞大家看到了嗎?活捉皮卡丘。這幾天有一個非常火的虛擬現實遊戲。不是再跟左邊一樣講虛擬現實,而是講給我們帶來了一個把活生生的卡通形象放到我們面前,這是我們看到的幸福。所以對比左右兩個圖,不論是創業者還是一個媒體人,還是一個投資人。

給大家看一個蠻幸福的科幻。在此之前給我們講一講我們搜狗對於技術和幸福之間的聯繫和理解。其實有朋友跟我談搜索的時候說,王小川,你們要轉型做人工智慧了嗎?我說:不是,搜索本身就是一種人工智慧,而且是有幸福感的人工智慧。因為它能讓每個人變的更加強大,有時候我跟一個90後走在一塊。我發現它很厲害,它無所畏懼。因為它知道擁有了搜索之後,能夠解決它所有的問題。上面一搜索,有有答案。所以今天的這些年輕人,利用技術、利用搜索,變得更加的強大,擁有了更大的幸福感。

為什麼說搜索就是一種AI呢?

搜索第一部分是讓用戶先要去做一個關鍵詞的搜索,然後給它提供10條鏈接。這是搜索今天產品運行的基本方式,但是我們知道這個關鍵詞是我們最好的輸入模式嗎?

今天大家已經很習慣了,我回顧在1999年-2000年搜索剛剛出現的時候。我觀察過,那個時候大家更願意敲一個整句。發現:對不起,機器不能識別。所以大家訓練去使用了這樣一個關鍵詞。這個事情就像我們計算機使用滑鼠一樣,大家都會很習慣用滑鼠。但是今天我們發現,喬布斯告訴我們,更好的方式是用手指直接在屏幕上戳。所以關鍵詞的輸入,相對於人的自然輸入,就像用滑鼠和用手指自然表達一樣,是需要繼續去提升的。因此搜索引擎往下的進展方向,就是把一個關鍵詞讓人去想一個關鍵詞,變成人去表達一個完整的句子,機器找出中間的含義。

同樣的,10條鏈接,也不是我們最想用的方式,而是應該通過用戶的問句直接給出答案或者給出你的一個命令,機器去做執行。因此從今天搜索,當我們往下的進化,對搜索引擎的公司是一個漸進的過程,就像谷歌已經提到:「自己從一個移動互聯網公司變成一個人工智慧公司。」為什麼他沒有做到這個東西呢?聽了很好聽。對吧?是因為今天全人類的技術,能做到讓機器去理解人,能變成一個句子,能夠給出一個答案還是蠻有距離的。只是我們在這條道路往前走,所以對於搜索公司而言,人工智慧技術的引入不是顛覆新的市場,而是在原有的用戶需求裡面進行一個漸進性的改進。

搜索公司本身就在做人工智慧。如果大家看搜狗覺得不過癮,可以看谷歌,它已經代表了人工智慧在今天應用的最高峰。因此在未來的方式裡面,類似於像Siri或者其它的人工智慧的交互引擎是我們共同的夢想。我個人的判斷,這樣的一個未來更多是屬於搜索公司的。


是必須這樣。

未來應用會越來越智能,不管是搜狗輸入法要語音輸入,不被顛覆行業第一的位置,還是搜狗搜索要追上百度,都必須玩人工智慧,這是現狀。

可以算大勢所趨吧。

但是玩不好就成了噱頭了,很可能掉隊,就的好就會彎道超車。

歡迎關注我~


推薦閱讀:

MAC多原混合共識機制 ,區塊鏈華山論劍奪冠,武功秘籍解析
諾基亞公布5G專利費預期,5GiPhone專利費每台超$21
HOW:搭建消費者和生活達人之間的橋樑,做消費領域的知乎
《三體》中的,技術大爆炸,在現實生活中是否可能,概率有多大?

TAG:科技 | 王小川 | 人工智慧 |