發布知音引擎,搜狗為何能在人工智慧技術上屢佔先機?
文 ▍李東樓(微信號:lidonglou)
在美國導演斯派克·瓊斯編劇並執導的一部科幻愛情片《她》(Her)當中,語音交互幾乎成為了人們與手機、電腦等設備進行交互的唯一手段,打電話、寫信、處理工作郵件等等,都通過語音向計算機發出指令。而且其中的人工智慧操作系統OS1還與人類有了情感交流,談起了戀愛,而影片的背景被設定在2025年,也就是從現在算起九年之後。
當然,我們無法預測,人工智慧在九年後究竟會不會發達到這個地步?但眼下可以肯定的是,人工智慧技術確實已經開始從實驗室逐步走近我們的生活,尤其是今年年初的谷歌alphago圍棋機器人和李世石的人機對決大戰,更是讓人們首次見識到人工智慧的強大之處。而在昨天,搜狗語音發布了不僅「能聽會說」,還具有「能理解會思考」的能力的語音交互引擎技術—知音,這再次刷新了在場所有人對於人工智慧技術發展的認知。
搜狗知音引擎發布,展現搜狗在人工智慧方面的自信
就如同影片《她》當中,男主人公通過語音寫信一般,基於語音識別和語義理解技術方面的進步,搜狗語音早已達到了可以實時轉寫的地步。值得一提是,在昨天的發布會上,嘉賓的發言就通過搜狗知音交互引擎實時轉寫並呈現在大屏幕上,不僅語音識別速度快,而且準確率也相當高,基本上能夠達到90%以上,令人驚嘆技術的進步。
而這還只是搜狗知音引擎的簡單「炫技」,除了語音識別之外,根據搜狗CTO楊洪濤介紹,搜狗知音引擎還支持用戶直接用自然語言進行糾錯,比如用戶可以說:「把『張』修改為立早『章』,或者把『張』修改為文章的』章』。並且還支持多輪對話,比如用戶說我要去首都機場,搜狗知音引擎便會問 T1還是 T2,當用戶確定航站樓後,它會問是出發還是接人。這就意味著搜狗知音引擎能夠處理更加複雜的交互邏輯,以及更好的感知用戶語音請求背後的真正需求,這顯然語音交互方面的一大技術進步。
要知道,在兩年前,尤其是蘋果Siri的推出,語音交互作為一種面向未來的交互方向,就備受各大互聯網公司的重視和看好。包括搜狗、百度、微軟等科技公司都推出了語音助手產品,期待產品能夠作為移動互聯網的一大入口。不過,現在看來,無論是Siri,還是微軟的小娜,都在用戶短暫的熱捧之後,漸漸沉默。事實上,這其實算是第一代的人工智慧初級產品,這些產品更多的是扮演著一個小助手或者秘書的角色,只能夠簡單的處理一些打電話、發簡訊、天氣預報查詢等等,一旦遇到稍微複雜的問題,語音助手便無法處理,一般都只好賣萌耍滑,這就使得產品的實用性並不強,用戶嘗試使用更多的是抱著娛樂的心態,而並不是真正的剛性需求。
不過,時隔兩年之後,各大科技公司的語音交互技術有了顯著的提升。尤其是在這次搜狗發布的語音交互引擎技術當中更能夠感受到技術的進步之快。根據了解,目前搜狗的語音交互引擎技術已經應用在包括搜狗輸入法、搜狗搜索、搜狗地圖等在內的搜狗全線產品當中,而根據搜狗語音交互中心負責人王硯峰在現場的演示,運用在搜狗搜索、搜狗地圖導航等應用上的搜狗語音交互引擎技術,在語音識別率以及多輪語音交互的處理等方面,已經顯著領先於競爭對手。
而且,這並不是搜狗第一次展現自己在智能語音方面的技術能力,以及布局人工智慧技術的決心。在今年6月份的搜狗輸入法十周年上,搜狗CEO王小川就提出了將人工智慧定位搜狗輸入法的下一階段戰略發展的新方向,搜狗CTO楊洪濤則首次透露了搜狗輸入法的快速分享、聰明回復和妙筆修飾等目前正在研發的三個能夠增強用戶表達能力的人工智慧新技術;而在7月份剛剛結束的奇點創新者峰會上,搜狗CEO王小川更是直接邀請一名現場觀眾上台直接演示完全通過自然語音來發送一段簡訊息,這也體現了搜狗在其人工智慧技術方面的強大自信。
搜狗知音引擎發布背後,搜狗早有「預謀」
另一方面,儘管搜狗今年才開始陸續對外展示自己在人工智慧技術實力,但顯然搜狗在人工智慧的研究和布局並不是剛剛開始。實際上,搜狗在人工智慧領域的研究和布局早已開始,搜狗CTO楊洪濤在知音交互引擎發布會上就透露:「搜狗從12年開始研發智能語音技術,並在13年開始進行深度學習,自然交互和知識計算是搜狗在人工智慧領域的兩大戰略方向,目前搜狗在人工智慧領域的研發已經全面展開。」
搜狗在人工智慧領域的布局不僅起步早,而且與谷歌、百度等搜索引擎公司一樣,屬於天生就擁有人工智慧基因的公司。這是因為搜索引擎擁有海量的搜索數據,而通過數據挖掘之後,便能夠實現人工智慧的最後一個階段-機器深度學習。也因如此,我們看到,谷歌不僅推出了圍棋機器人alphago,更是在更名為Alphabet後,全面轉型成為了人工智慧公司;而百度同樣將人工智慧作為其未來的一大發展方向。搜狗則在今年第一季度發布財報時,由搜狗CEO王小川首次明確其成為「中國人工智慧領域的創新者和領先公司」的決心和野心。而與此相伴隨的則是在人工智慧技術方面的大手筆投入。最具有代表型的便是,今年4月份向清華大學捐贈1.8億元,與其聯合成立「清華大學天工智能計算研究院」,深入開展人工智慧領域的前沿技術研究。這意味著搜狗開始全面從搜索引擎公司升級成為人工智慧公司。
實際上,搜狗之所以能夠在智能語音技術方面能夠如此大的突破,除了具有人工智慧基因和提早布局之外,更重要的還是要歸功於搜狗在此前十幾年的過程中,積累的數億用戶以及由此每天產生的海量交互數據,而這些為機器學習提供了優秀的「土壤」,也使得人工智慧越來越聰明。搜狗語音交互引擎這一成果取得的背後,顯然離不開日均語音搜索次數增長超過4倍的搜狗搜索和擁有海量詞庫、日均語音輸入超過1.4億次的搜狗手機輸入法,正是這兩大產品聯手讓搜狗智能語音成為目前國內語音輸入功能使用量最大的移動手機產品,而這就意味著搜狗的語音交互技術有更多的「學習」機會。
不過,儘管搜狗語音交互引擎技術在當下已經足夠讓人驚艷,但是離電影《她》當中所描述的人工智慧場景還有距離。比如《她》當中人工智慧OS1除了幫助處理工作和生活瑣事之外,還能夠與人類戀愛,並深刻理解人類複雜的感情。顯然,現在通過自然語言實現人機交互只是人工智慧的第一步,未來真正實現擬人化的交流甚至更高級的情感交流才是更高的境界,也因如此,下一次搜狗們能夠推出什麼樣的驚艷的產品或技術就更值得期待。
推薦閱讀:
※AI醫療變現這麼虛!先聊聊學術不好么?
※PyTorch 這一年——十佳開源項目
※深度學習小實驗1:使用RNN教AI學會吟詩作賦