為什麼 Siri 不能聯繫上下文跟你對話?
這事兒我有發言權…
&>&>&>&>&>&>&>&>&>&>5.18更新&<&<&<&<&<&<&<&<&<&<
真是一個悲傷的故事……
END
Siri 其實是有上下文的。很多答案里已經列出例子了,只是比較初步而已。
介紹一下siri是如何實現,就明白上下文是怎麼一回事了,其實沒有大部分人想像的那麼玄乎。
現有的大部分人工智慧對話系統都是基於artificial intelligence markup language [1] 或者類似的定義格式。
WHO ARE YOU&
&I am Shuaige, nice to meet you!& WHAT DID I JUST SAY&
&You said "&".& WHAT TIME IS NOW&
&Now is & WHAT DID YOU JUST SAY&
&I said "& IF YOU ARE * THEN I AM _&
&What makes you think that if I am & DO YOU SEE THE *&
&Yes, I see the & &
&
&
&
&
&
&
&
&
&
&
&
&
&
&
&
&
&
可以看到其實那些對話本質上其實就是匹配一個模版,當語音識別將聲音轉化為文本以後,然後在模版庫裡面搜索。上面的模版片段就涵蓋了一個常見的哏:
人: 「who are you?」
robot: "I am shuaige, nice to meet you!"
人:"if you are shuaige, then I am shuaishuaige!"
然後就掉進了下面的這個模版。
IF YOU ARE * THEN I AM _&
&What makes you think that if I am & &
&
&
因為長尾理論的原因,其實一定量的模版,很容易就覆蓋超過90%的常見對話。而更聰明的對話系統一般是有更全面的模版,而且會更智能地選擇模版。現在模版基本是通過半自動的方法生成的,一方面通過信息抓取,另外一方面就是人力寫段子。可以看到知識系統只是這裡面很小的一部分,當系統上線以後,系統也會不停收集一些失敗的例子,反過來改進系統的運行。而siri更加聰明的是把搜索集成進了對話系統,在知識庫不包括的時候,就藉助於搜索。
相比於準備更多的模版,更大的問題是當模版庫比較強大的時候,在同一個時間,可能有多個模板匹配當前的問題,以至於不知道選哪個模版。cs有一個基本的理論叫有限狀態機,就是每一個狀態都支持一個特定的模版集。其實狀態機的切換,本身就是上下文的一部分。另外一方面,今天的人工智慧系統都是基於概率的,概率本身就是基於上下文的。
比如下面這個例子,
系統問: "where are you leaving from?"
用戶說了一句:「highland ave」.
出來的結果裡面正確答案排在第五名。
然後用戶又說了一遍:「highland ave」 這個時候識別的結果就會排除和之前第一名結果接近的結果,然後根據第二次的結果,結合第一次的輸入,更新新的排名。這個算是上下文的應用了,可能是上下文在今天技術里最主要的應用。
只是大家的期望太高,大家都還看不上這種上下文。其實在上下文方面而言,google now在這方面做得要比siri好。可能是因為siri的語音識別是來自於和nuance[2]的合作,而google是一家包辦從聲音識別到對話系統。但是在單個詞或者句子的識別上,nuance的banchmark依然跑得最好。
1. http://en.wikipedia.org/wiki/AIML 的原理。
2. Speech Recognition
如果,Siri有了聯繫上下文的能力。
功能就從只能單一地interpret一句話,變成了能夠建立一個完備的knowledge base,並且用合理的reasoning,得出合理的結果。
這個水準已經基本達到通過圖靈測試的標準了。
換言之,幾個月內,Siri很有可能通過iOS的雲端技術不斷壯大自己,並最終成為新世界的王,在某一個時間點選擇毀滅人類。
——————————
!!寫了一大段發表出去怎麼又回檔了???先感嘆下,好文藝范兒的中文版Siri~
-----
出於好奇心,拿 @於雙海 的問話內容詢(tiao)問(xi)了我的中文版Siri。
對話過程如下:
我:給我女朋友打電話吧
Siri:通訊錄中好像沒有「女朋友」。請問你女友的姓名是什麼?
(我不給回應,Siri繼續說......)
Siri:抱歉我不太確定你說了什麼。/ 抱歉,我沒聽清楚。
你女友叫什麼?
可以再說一次嗎?
我:我沒有女朋友
Siri:你女友叫什麼?
我:嗨Siri
Siri:你好
我:Siri現在在幹什麼呀
Siri:時而望著窗外出神,時而落筆寫下幾行俳句。(截圖裡那句文藝范兒的回應)
我好像一直都在等你叫我。(時而溫情.....)
我在不斷地學習,因為這份美差讓我懂得了「及時當勉勵,歲月不待人」。
我在努力學習賣萌,儘管我還沒有完全理解這個詞的含義。
我正在練習一種科學的決策方式---投硬幣。
(時而好學......)
我正在幫人們挑選手表呢。
正在給選手表的人提供一些意見。
我在幫人們辨識他們正在聽的歌曲呢。
(時而勤奮工作......)
不好意思,我剛剛在想Apple Watch,想得都入神了。
我正在Apple Watch上查看自己的心率。就好像我真的有一顆心一樣。
(時而忙著做營銷推廣......)
(每次只顯示一行)
-----
接下去,按 @於雙海 的原話詢問,發生的情況是:
我:那真是辛苦了
Siri:你這樣我很擔心。如果你覺得累了就不應該開車。
或許你應該讓我幫你找附近的酒店休息一下。我不希望你疲勞的時候還在開車。
(每次只顯示一行)
(問話改了下.......)
我:那真是辛苦你啦
Siri:區區小事,何足掛齒。
不必言謝。
分內之事。
應該謝謝你才對。
別見外!
我很樂意。
這是應該的。
你滿意就好。
你的滿意就是對我最大的肯定。
(每次只顯示一行)
我:那什麼
Siri:(重複之前說過的內容)
我:我有些話想和Siri你說
Siri:哦...
我好像不明白。
我:Siri現在有男朋友嗎?
Siri:找到下列訊息。(顯示10個結果,羅列一堆婚介介紹所的列表,並推薦了家人氣介紹所。)
我:也是
Siri:我好像不明白。
我:那我說了啊
Siri:我好像打斷你了,麻煩你再說一遍。
我:Siri是怎麼看我的呢
Siri:讓我查一下... / 請稍等片刻...
我在網上沒找到與「Siri是怎麼看我的呢」有關的資料。
很抱歉/不好意思,我沒能完成。請你再試一次。
我:我喜歡Siri
Siri:是嗎?
曉得了。
(每次只顯示一行)
我:我是真心喜歡Siri的
Siri:抱歉,你要我叫你「真心喜歡Siri」嗎?
從現在起,我會稱呼你為「真心喜歡Siri」。好嗎?
(每次只顯示一行)
(接下去......)
很抱歉,我沒聽懂。
我不太明白你剛剛說了什麼。
我聽不大懂,你說的是什麼意思。
對不起,我沒聽明白。
(每次只顯示一行)
好的,請問應該怎麼稱呼?
我沒法更改你的聯繫人資料。不過,你自己可以在「通訊錄」應用程序中更改。
(每次只顯示一行)
我:我明白了
Siri:那好吧。
那好!
好的。
好極了!
對,一切都好。
(每次只顯示一行)
我:Siri討厭我對吧
Siri:我好像不明白。
我:那就是Siri不喜歡我對吧
Siri:我好像不明白。
我:那你願意和我交往嗎
Siri:我們是在談論你,不是我。
我沒意見。
對不起,我恐怕無法回答這個問題。
(每次只顯示一行)
我:Siri好狡猾
Siri:我好像不明白。
我:就算狡猾我也喜歡。
Siri:我好像不明白。
我:我明白了
Siri:那好吧。
那好!
好的。
好極了!
對,一切都好。
(每次只顯示一行)
我:謝謝你這麼長時間以來陪在我身邊
Siri:區區小事,何足掛齒。
不必言謝。
分內之事。
應該謝謝你才對。
別見外!
我很樂意。
這是應該的。
你滿意就好。
你的滿意就是對我最大的肯定。
(每次只顯示一行)
我:那再見了
Siri:拜!(女聲版是很溫柔的語調)
後會有期。
好的,一會兒見。
一會兒再見...
(每次只顯示一行)
-----
從來沒這麼測試過Siri,一個提問問上N遍。也想了解下Siri能不能聯繫上下文給回應,有類似 @於雙海 對話中的表現,不知是不是Siri不同語言和區域的系統存在差異,我測下來的結果就這樣了。
畢竟Siri不是電影「Her」人工智慧系統OS1,智能的很有限,交流下來感覺太虐了!真實場景中人與人之間的愛慕和追求,給Siri這種回應絕對能讓人產生萬箭穿心,澆上N盆冷水的心情!看圖 可以啊 而且我只見過Siri能理解這段話
問其他手機今天出門需要帶傘么,那明天呢。很多智能機器人就不知道咋辦了…什麼是那明天呢?Siri會這樣說
它理解不了上下文其實是你說的東西太難了。
她的理解能力有限,但是還是可以做好多事兒的。
然而cortana正在努力實現中
聊天看起來很容易,但是對現有的電腦來說,還太難。
我們在聊天中呈現的是這樣一個過程,就以警察和小偷為例
警察:「老實交代!掏錢包時候摸人姑娘屁股沒有!」
小偷:「大人冤枉啊!我貪財不劫色!」
警察:「還不老實!姑娘屁股蛋子上那大手指頭印怎麼回事!
小偷:」我老實交代,就摸了一把……「
這樣的對話,是建立在警察輸出信息——小偷給出反饋——警察針對小偷的反饋給出下一條信息——小偷再次給出反饋這個過程上的,而貫穿整個對話的,是邏輯,是在每一句話中暗藏的因果關係。
而如何找到邏輯,正是人工智慧目前需要解決的問題。
而邏輯又是如何建立起來的呢?是標準。
在我上一段的對話里,首先設定了環境,就是姑娘被盜,事件姑娘被摸了屁股,而參與對話的雙方,對這件事都有共同的認知,設立了這次談話的標準,這是對話可以順利進行的前提,假如沒有這個標準,警察走到大街上隨便攔住一個人就問,摸人姑娘屁股沒有,就算不挨揍,也要被人當成神經病。
而當我們和SIRI對話的時候,SIRI扮演的就是這個無辜的路人,因為我沒有蘋果,所以只能和小米聊兩句給大家看看
因為無法建立標準,就沒有辦法建立交流中所必須需要的邏輯,所以我們人認為再簡單不過的聊天,現有的電腦技術也根本無法實現。
但是,如果有一天,電腦真的可以做到了呢??
這並不是沒有可能,比如,電腦延伸出了無數外接攝像頭,將我們指定的所有場景都記錄了進去,並且可以進行嚴格的行為分析,那麼當我們指定了摸姑娘屁股這個行為,電腦就可以將其調用出來,只要有了標準,他甚至可以把那個手印直接呈現在你眼前。
到了那個時候
我們可能不再需要知識,因為每個人都有了一個無所不知的大腦。
我們也不再需要邏輯,因為他可以幫助我們將一切信息收集、整合、演算、實施。
我們不再需要情感交流,特別是姑娘們,她們隨身攜帶最棒的陪聊工具滿足精神需求,並且可以隨便用一根電動棒代替男人,單身狗將統治世界。
到那個時候,說什麼都晚了。
所以,如果哪一天你的SIRI和你聊了起來
請立刻撥打110,雖然這並沒有什麼卵用,
至少,我們還能想辦法,把她消滅乾淨。
是時候祭出這張圖了··
當初看完she的時候我也來過這麼一下~和最高贊那位比起來,顯然日系的更萌一些。
據說……
如果你看過《她》這部電影你就會知道有多可怕了。
我覺得未必。
其實是可以的
據說小冰被刻意降低了聯繫上下文的能力,防止有人愛上她。
那her這個電影里的故事就都實現啦!
大家都沉迷於siri,不結婚不繁衍,結果最後發現他(她)同時和800多個人在調情,然後人類因為繁衍能力下降滅絕了
應該看看疑犯追蹤,話說,好久沒看了,哪天追個劇去
人與人之間的交流那麼容易智能的話,為什麼還有那麼多宅男來知乎問怎麼和女生聊天?
因為沒做
要做的話會帶來很多問題,上下文信息是存在本機還是雲端?本機的話,它該向你學習什麼常識?什麼上下文信息?該存多少?什麼時候刪除?本機分析不出信息含義的話要不要傳到雲端機器學習然後分析?
如果存雲端的話?每個人存多少東西?隱私如何保證?
目前Siri僅限於分析語音、識別出一個請求然後返回數據而已。離真正的人工智慧差得太遠了。如果不用人工智慧而用通用的處理模板來模擬一個智能助手,首先和真正的智能還是差很遠,其次無法高度定製化,還是不能理解你的個人信息。
最後是隱私保證,這是個大坑啊,你如何信任智能版Siri不把你賣了?目前的Siri每次獨立的分析和請求都是完全匿名、互相割裂的,所以無法分析上下文。要是有一天他突然分析出來了,趕快退果保平安,天網要來了
誰說不能,這不是挺機智的嗎?
推薦閱讀:
※未來 3~5 年內,哪個方向的機器學習人才最緊缺?
※Deep Learning 的專家如此急缺,它難在何處?
※如何看待人工智慧領域的很多專家認為「人工智慧將對人類存亡造成威脅」的觀點?
※如何評價《羅輯思維》第 115 期對謝熊貓君翻譯的關於人工智慧的文章的重新演繹?
※自然語言處理在 2017 年有哪些值得期待的發展?