智能自然語言交互會不會成為下一代人機交互方式的殺手鐧?

在進入移動互聯網時代之後,社交網路會發揮更大的作用。用戶需要篩選、接收、處理的信息量會越變越大。而不同的操作系統有不同的用戶界面,操作方式,系統功能。普通用戶在不同系統,產品之間切換的時候,還需要花費大量時間去熟悉產品。然而用戶與生不變的是自然語言交流能力。所以智能自然語言交互(Siri那樣的產品,雖是一個雛形)會不會成為下一代人機交互方式的殺手鐧?


個人認為:自然語言交互其實本質並不僅僅是一直交互方式,而是對於人和系統之間關係的重新定位和組織。對於目前的計算機系統來說,其交互的過程仍然是「發出指令、接收指令、運算(思考)、反饋結果」的循環,自然語言操作也不會改變這個基本過程,因為這本身就是「對話」。自然語言改變的是系統和人之間的關係。

系統的優化和更新有兩個基本方向:

  • 更容易理解和操作
  • 更智能化的響應

而這兩個方向的終極目標都是要將機器和數字變成「人」——雖然這聽起來有些不舒服,但這的確是系統改進的終極目標。而自然語言的交互正是這種理念的體現,通過人的自然的語言來發出指令,而系統能夠理解並進行消化,並且給出自然語言的反饋,那麼這個對話就已經不能稱之為人機交互了


自然語言當然好,幾十年前大家就知道如果誰做出來就能改變世界,不過可惜這裡面最大的問題不是創意,而是技術,識別不準確更無法做理解,所以什麼想法都泡湯。


我認為是,因為人們天然的惰性以及對交互「更簡單、更自然、更高效」的交互追求。自然語言對話顯然滿足這一點。不過,自然語言不一定是以語音形式承載。

這是雷科技的一個分享,裡面部分回答了您的問題:

http://www.leikeji.com/thread-760-1-1.html


語音識別應該是人類最自然的交互方式。人與人面對面的時候,我不會寫一紙條給你,我會跟你說話,這個實際上是一個最基礎的語音識別。

語音識別本身並不完全是語音識別,它還包括語音、語義和智能化,這就意味著,完成一次交互問答的過程,需要語音識別、人工智慧等等多項技術來支持。以詢問天氣預報為例,開始時跟車載系統講:「北京明天的天氣怎麼樣?」系統會告訴你北京明天的天氣情況,然後你緊接著問:「那上海呢?」這樣的表達,對著一個普通的成年人,對方一定是能聽明白你想進一步了解上海的天氣,但是,純語音識別的機器是聽不懂的,加上語義識別後,它會知道這是跟上句有關係的——你問的是上海的天氣。當然在與機器的交互對話中,會需要你反覆確認表達的意思。這個過程相對於人與人之間的交流互動,雖然顯得有些繁瑣,但用於人機交互時帶來的是信息的精準度。

對於語言交互的要求越高,對交互系統來說,技術上的難度也就越大。人和人對話時方言都可能帶來交流的障礙,何況是人和機器的語音交流。從鍵盤機到觸摸屏,一步步的延伸,最終目的是為了判斷使用者想要的東西。以前更多是把使用成本交給用戶,去點某個鍵、找某個菜單,現在交給語音。這樣的交互系統要如何設計?要基於大數據的挖掘,如何從技術上找到存在的問題或著痛點所在,這一點並不簡單。

人機交互的方向就是不斷向「人」的一側偏移。機器應該學習人,更傾向於像人一樣說話,而不是不說人話,這樣的交流方式更自然,更符合人的本能。雖然說人機交互技術層面的問題還有很多,但是對於尤其像汽車這樣的行業,語音交互更符合用戶的使用習慣,使用場景,也必將是被廣為運用的交互方式。


推薦閱讀:

TAG:互聯網 | 交互設計 | 下一代互聯網 | 交互方式 |