智能自然語言交互會不會成為下一代人機交互方式的殺手鐧？

02-07

在進入移動互聯網時代之後，社交網路會發揮更大的作用。用戶需要篩選、接收、處理的信息量會越變越大。而不同的操作系統有不同的用戶界面，操作方式，系統功能。普通用戶在不同系統，產品之間切換的時候，還需要花費大量時間去熟悉產品。然而用戶與生不變的是自然語言交流能力。所以智能自然語言交互(Siri那樣的產品，雖是一個雛形）會不會成為下一代人機交互方式的殺手鐧？

個人認為：自然語言交互其實本質並不僅僅是一直交互方式，而是對於人和系統之間關係的重新定位和組織。對於目前的計算機系統來說，其交互的過程仍然是「發出指令、接收指令、運算（思考）、反饋結果」的循環，自然語言操作也不會改變這個基本過程，因為這本身就是「對話」。自然語言改變的是系統和人之間的關係。

系統的優化和更新有兩個基本方向：

更容易理解和操作
更智能化的響應

而這兩個方向的終極目標都是要將機器和數字變成「人」——雖然這聽起來有些不舒服，但這的確是系統改進的終極目標。而自然語言的交互正是這種理念的體現，通過人的自然的語言來發出指令，而系統能夠理解並進行消化，並且給出自然語言的反饋，那麼這個對話就已經不能稱之為人機交互了

自然語言當然好，幾十年前大家就知道如果誰做出來就能改變世界，不過可惜這裡面最大的問題不是創意，而是技術，識別不準確更無法做理解，所以什麼想法都泡湯。

我認為是，因為人們天然的惰性以及對交互「更簡單、更自然、更高效」的交互追求。自然語言對話顯然滿足這一點。不過，自然語言不一定是以語音形式承載。

這是雷科技的一個分享，裡面部分回答了您的問題：

http://www.leikeji.com/thread-760-1-1.html

語音識別應該是人類最自然的交互方式。人與人面對面的時候，我不會寫一紙條給你，我會跟你說話，這個實際上是一個最基礎的語音識別。

語音識別本身並不完全是語音識別，它還包括語音、語義和智能化，這就意味著，完成一次交互問答的過程，需要語音識別、人工智慧等等多項技術來支持。以詢問天氣預報為例，開始時跟車載系統講：「北京明天的天氣怎麼樣？」系統會告訴你北京明天的天氣情況，然後你緊接著問：「那上海呢？」這樣的表達，對著一個普通的成年人，對方一定是能聽明白你想進一步了解上海的天氣，但是，純語音識別的機器是聽不懂的，加上語義識別後，它會知道這是跟上句有關係的——你問的是上海的天氣。當然在與機器的交互對話中，會需要你反覆確認表達的意思。這個過程相對於人與人之間的交流互動，雖然顯得有些繁瑣，但用於人機交互時帶來的是信息的精準度。

對於語言交互的要求越高，對交互系統來說，技術上的難度也就越大。人和人對話時方言都可能帶來交流的障礙，何況是人和機器的語音交流。從鍵盤機到觸摸屏，一步步的延伸，最終目的是為了判斷使用者想要的東西。以前更多是把使用成本交給用戶，去點某個鍵、找某個菜單，現在交給語音。這樣的交互系統要如何設計？要基於大數據的挖掘，如何從技術上找到存在的問題或著痛點所在，這一點並不簡單。

人機交互的方向就是不斷向「人」的一側偏移。機器應該學習人，更傾向於像人一樣說話，而不是不說人話，這樣的交流方式更自然，更符合人的本能。雖然說人機交互技術層面的問題還有很多，但是對於尤其像汽車這樣的行業，語音交互更符合用戶的使用習慣，使用場景，也必將是被廣為運用的交互方式。