AI時代,為什麼懂語音者得天下?
語言是人類重要的交際工具,是人與人之間進行溝通交流的基礎表達符號。
無論時代如何進步,世界如何改變,這種人們之間最基礎的表達符號是不會改變的。儘管被一些所謂未來學家預言談論「超級智能」、「奇點」、「人類危機論」的人工智慧時代正全面襲來,但語言就像那戈壁灘上的胡楊,永遠屹立不倒。
眾所周知,人工智慧是人類創造的,是人類為了尋求更加智能的社會而創造的工具,既然是工具,那必定沒有思想、沒有感知和認知,這也是人區別於其它物種的本質。那麼如何讓人工智慧在人類發出指令之後能夠正確的接收指令並理解,也就是讓人工智慧有感知和認知的能力,成為了各大科技公司最主要、也是最終一絕勝負的研究方向,因為一個沒有任何感知和認知的人工智慧產品,就如同一塊鍍上了一層金的廢鐵,好看不中用。
懂語言者、得天下
就像語言是人與人之間交流的符號一樣。那麼人與人工智慧之間的交流語言就是自然語言理解。目前,隨著深度學習技術的不斷深入的研究,自然語言理解技術也逐漸的成熟。不光是國外,像國內的阿里巴巴,今年的雙11期間,人工智慧助手「阿里小蜜」在當天承擔了95%的客服諮詢,「螞蟻安安」一天可以回答800萬個提問,為其整體節省了50%—60%的成本。可以說人工智慧助手已經完全有能力達到人工智慧客服的水平。
日前,美國國家工程院院士、微軟全球執行副總裁沈向洋博士在2017年中國計算機大會上就明確表示:當前人工智慧最主要的兩個方向是感知和認知,人工智慧的下一個突破口在語言理解,懂語言者、得天下,只有我們明白自然語言是怎麼回事,才能真正把人工智慧這件事情講清楚。
其實,各大科技公司、巨頭比誰都明白「懂語言者、得天下」的道理,像早期我們最為熟悉的Siri就是被蘋果收購的基於神經網路演算法的語音識別,還有像Google推出的Google Home,Amazon推出的智能家居語音產品Echo。而在國內BAT也同樣在打造自己的語音王國,像百度的DuesOS、騰訊才推出的語音助手「騰訊叮噹」、阿里的天貓精靈X1。另外還有一些國內垂直類的AI創業公司,比如雲知聲、聲智科技等等。
那麼,為什麼說的懂語音者、得天下呢?
自然語言理解的本質什麼
像筆者開頭說的,一個沒有任何感知和認知的人工智慧產品,就如同鍍上了一層金的廢鐵,表面華麗、實則腐朽,這裡筆者把人工智慧上的感知和認知統稱為認知智能。那麼什麼是認知智能?微軟全球執行副總裁沈向洋是這樣解釋的,認知智能是解決語言的理解,對用戶的理解,知識工程、下棋、問答、解決用戶問題、寫作、對話、藝術創作。
我們不妨仔細的琢磨琢磨這8個問題,哪一個不需要強的邏輯思維能力、感知和認知能力,其中下棋需要有觀全局的能力、寫作需要有清晰的邏輯思維能力,而最難的藝術創作,不僅需要有感知和認知的能力,同時還需要具備豐富的想像力和捕捉靈感的能力。當然還有其它我們沒有提到的。然而,這些是人類所擁有的特質,也正是人類區別於人工智慧最明顯的符號。
如果人工智慧沒有這種認知智能的特質,無論其多麼智能、多麼先進,也只能是人們用來處理人一些簡單、重複、高危......工作,其實也就相當於生產車間的一些機器手、自動打包機等等。而像目前人工智慧最落地的自動駕駛,AI遊戲哪一個不需要認知智能。
自然語言處理有待提升
雖然目前來說,自然語言理解技術實現了可以成功的落地。但仍然存在一些難以解決或有待深入提升的難點。比如口語對話就是自然語言理解技術實現的重要難點之一,口語不像書面語那樣正規,語言很隨意,並且經常可以遇到本是一個意思,卻說了兩句話,然後還可以省略、更正、倒敘等等。
那麼在這種不正規的語言表達中要通過自然語言識別出來,難免會給其增加相當大的難度。畢竟人類發明語言,是經歷過了漫長的生物競爭才凈化出的交流符號,而人類的語言文明是經過了5000年歷史沖刷才有今天的。因此,「自然語言」的理解和處理,必然不會輕易達到成熟、頂峰。
【陳劍鋒,科技自媒體人、專欄作者,專註於科技、移動互聯網的發展。微信公眾號:陳劍鋒(QQ784580609)】
推薦閱讀: