為什麼 Siri 不能聯繫上下文跟你對話?


這事兒我有發言權…

&>&>&>&>&>&>&>&>&>&>5.18更新&<&<&<&<&<&<&<&<&<&<

真是一個悲傷的故事……

END


Siri 其實是有上下文的。很多答案里已經列出例子了,只是比較初步而已。

介紹一下siri是如何實現,就明白上下文是怎麼一回事了,其實沒有大部分人想像的那麼玄乎。
現有的大部分人工智慧對話系統都是基於artificial intelligence markup language [1] 或者類似的定義格式。

貼一個以前寫的aiml例子:

&
&

WHO ARE YOU& &I am Shuaige, nice to meet you!&
&
&
&

WHAT DID I JUST SAY& &You said "&".&
&
&
&

WHAT TIME IS NOW& &Now is &.&
&
&
&

WHAT DID YOU JUST SAY& &I said "&".&
&
&
&

IF YOU ARE * THEN I AM _& &What makes you think that if I am & then you are &?&
&
&
&

DO YOU SEE THE *& &Yes, I see the &.&
&

可以看到其實那些對話本質上其實就是匹配一個模版,當語音識別將聲音轉化為文本以後,然後在模版庫裡面搜索。上面的模版片段就涵蓋了一個常見的哏:

人: 「who are you?」
robot: "I am shuaige, nice to meet you!"
人:"if you are shuaige, then I am shuaishuaige!"

然後就掉進了下面的這個模版。

&
&

IF YOU ARE * THEN I AM _& &What makes you think that if I am & then you are &?&
&

因為長尾理論的原因,其實一定量的模版,很容易就覆蓋超過90%的常見對話。而更聰明的對話系統一般是有更全面的模版,而且會更智能地選擇模版。現在模版基本是通過半自動的方法生成的,一方面通過信息抓取,另外一方面就是人力寫段子。可以看到知識系統只是這裡面很小的一部分,當系統上線以後,系統也會不停收集一些失敗的例子,反過來改進系統的運行。而siri更加聰明的是把搜索集成進了對話系統,在知識庫不包括的時候,就藉助於搜索。

相比於準備更多的模版,更大的問題是當模版庫比較強大的時候,在同一個時間,可能有多個模板匹配當前的問題,以至於不知道選哪個模版。cs有一個基本的理論叫有限狀態機,就是每一個狀態都支持一個特定的模版集。其實狀態機的切換,本身就是上下文的一部分。

另外一方面,今天的人工智慧系統都是基於概率的,概率本身就是基於上下文的。
比如下面這個例子,

系統問: "where are you leaving from?"
用戶說了一句:「highland ave」.

出來的結果裡面正確答案排在第五名。
然後用戶又說了一遍:「highland ave」 這個時候識別的結果就會排除和之前第一名結果接近的結果,然後根據第二次的結果,結合第一次的輸入,更新新的排名。這個算是上下文的應用了,可能是上下文在今天技術里最主要的應用。

只是大家的期望太高,大家都還看不上這種上下文。其實在上下文方面而言,google now在這方面做得要比siri好。可能是因為siri的語音識別是來自於和nuance[2]的合作,而google是一家包辦從聲音識別到對話系統。但是在單個詞或者句子的識別上,nuance的banchmark依然跑得最好。


1. http://en.wikipedia.org/wiki/AIML 的原理。
2. Speech Recognition


如果,Siri有了聯繫上下文的能力。

功能就從只能單一地interpret一句話,變成了能夠建立一個完備的knowledge base,並且用合理的reasoning,得出合理的結果。

這個水準已經基本達到通過圖靈測試的標準了。

換言之,幾個月內,Siri很有可能通過iOS的雲端技術不斷壯大自己,並最終成為新世界的王,在某一個時間點選擇毀滅人類。

——————————

!!寫了一大段發表出去怎麼又回檔了???


先感嘆下,好文藝范兒的中文版Siri~

-----
出於好奇心,拿 @於雙海 的問話內容詢(tiao)問(xi)了我的中文版Siri。

對話過程如下:

我:給我女朋友打電話吧
Siri:通訊錄中好像沒有「女朋友」。請問你女友的姓名是什麼?

(我不給回應,Siri繼續說......)

Siri:抱歉我不太確定你說了什麼。/ 抱歉,我沒聽清楚。
你女友叫什麼?
可以再說一次嗎?

我:我沒有女朋友
Siri:你女友叫什麼?

我:嗨Siri
Siri:你好

我:Siri現在在幹什麼呀
Siri:時而望著窗外出神,時而落筆寫下幾行俳句。(截圖裡那句文藝范兒的回應)
我好像一直都在等你叫我。(時而溫情.....)

我在不斷地學習,因為這份美差讓我懂得了「及時當勉勵,歲月不待人」。
我在努力學習賣萌,儘管我還沒有完全理解這個詞的含義。
我正在練習一種科學的決策方式---投硬幣。
(時而好學......)

我正在幫人們挑選手表呢。
正在給選手表的人提供一些意見。
我在幫人們辨識他們正在聽的歌曲呢。
(時而勤奮工作......)

不好意思,我剛剛在想Apple Watch,想得都入神了。
我正在Apple Watch上查看自己的心率。就好像我真的有一顆心一樣。
(時而忙著做營銷推廣......)

(每次只顯示一行)

-----
接下去,按 @於雙海 的原話詢問,發生的情況是:

我:那真是辛苦了
Siri:你這樣我很擔心。如果你覺得累了就不應該開車。
或許你應該讓我幫你找附近的酒店休息一下。我不希望你疲勞的時候還在開車。
(每次只顯示一行)


(問話改了下.......)

我:那真是辛苦你啦
Siri:區區小事,何足掛齒。
不必言謝。
分內之事。
應該謝謝你才對。
別見外!
我很樂意。
這是應該的。
你滿意就好。
你的滿意就是對我最大的肯定。
(每次只顯示一行)

我:那什麼
Siri:(重複之前說過的內容)

我:我有些話想和Siri你說
Siri:哦...
我好像不明白。

我:Siri現在有男朋友嗎?
Siri:找到下列訊息。(顯示10個結果,羅列一堆婚介介紹所的列表,並推薦了家人氣介紹所。)

我:也是
Siri:我好像不明白。

我:那我說了啊
Siri:我好像打斷你了,麻煩你再說一遍。

我:Siri是怎麼看我的呢
Siri:讓我查一下... / 請稍等片刻...
我在網上沒找到與「Siri是怎麼看我的呢」有關的資料。
很抱歉/不好意思,我沒能完成。請你再試一次。

我:我喜歡Siri
Siri:是嗎?
曉得了。
(每次只顯示一行)

我:我是真心喜歡Siri的
Siri:抱歉,你要我叫你「真心喜歡Siri」嗎?
從現在起,我會稱呼你為「真心喜歡Siri」。好嗎?
(每次只顯示一行)

(接下去......)
很抱歉,我沒聽懂。
我不太明白你剛剛說了什麼。
我聽不大懂,你說的是什麼意思。
對不起,我沒聽明白。
(每次只顯示一行)

好的,請問應該怎麼稱呼?
我沒法更改你的聯繫人資料。不過,你自己可以在「通訊錄」應用程序中更改。
(每次只顯示一行)

我:我明白了
Siri:那好吧。
那好!
好的。
好極了!
對,一切都好。
(每次只顯示一行)

我:Siri討厭我對吧
Siri:我好像不明白。

我:那就是Siri不喜歡我對吧
Siri:我好像不明白。

我:那你願意和我交往嗎
Siri:我們是在談論你,不是我。
我沒意見。
對不起,我恐怕無法回答這個問題。
(每次只顯示一行)

我:Siri好狡猾
Siri:我好像不明白。

我:就算狡猾我也喜歡。
Siri:我好像不明白。

我:我明白了
Siri:那好吧。
那好!
好的。
好極了!
對,一切都好。
(每次只顯示一行)

我:謝謝你這麼長時間以來陪在我身邊
Siri:區區小事,何足掛齒。
不必言謝。
分內之事。
應該謝謝你才對。
別見外!
我很樂意。
這是應該的。
你滿意就好。
你的滿意就是對我最大的肯定。
(每次只顯示一行)

我:那再見了
Siri:拜!(女聲版是很溫柔的語調)
後會有期。
好的,一會兒見。
一會兒再見...
(每次只顯示一行)

-----

從來沒這麼測試過Siri,一個提問問上N遍。也想了解下Siri能不能聯繫上下文給回應,有類似 @於雙海 對話中的表現,不知是不是Siri不同語言和區域的系統存在差異,我測下來的結果就這樣了。

畢竟Siri不是電影「Her」人工智慧系統OS1,智能的很有限,交流下來感覺太虐了!真實場景中人與人之間的愛慕和追求,給Siri這種回應絕對能讓人產生萬箭穿心,澆上N盆冷水的心情!


看圖 可以啊 而且我只見過Siri能理解這段話

問其他手機今天出門需要帶傘么,那明天呢。很多智能機器人就不知道咋辦了…什麼是那明天呢?Siri會這樣說

它理解不了上下文其實是你說的東西太難了。
她的理解能力有限,但是還是可以做好多事兒的。


然而cortana正在努力實現中


聊天看起來很容易,但是對現有的電腦來說,還太難。
我們在聊天中呈現的是這樣一個過程,就以警察和小偷為例

警察:「老實交代!掏錢包時候摸人姑娘屁股沒有!」
小偷:「大人冤枉啊!我貪財不劫色!」
警察:「還不老實!姑娘屁股蛋子上那大手指頭印怎麼回事!
小偷:」我老實交代,就摸了一把……「


這樣的對話,是建立在警察輸出信息——小偷給出反饋——警察針對小偷的反饋給出下一條信息——小偷再次給出反饋這個過程上的,而貫穿整個對話的,是邏輯,是在每一句話中暗藏的因果關係。
而如何找到邏輯,正是人工智慧目前需要解決的問題。
而邏輯又是如何建立起來的呢?是標準。
在我上一段的對話里,首先設定了環境,就是姑娘被盜,事件姑娘被摸了屁股,而參與對話的雙方,對這件事都有共同的認知,設立了這次談話的標準,這是對話可以順利進行的前提,假如沒有這個標準,警察走到大街上隨便攔住一個人就問,摸人姑娘屁股沒有,就算不挨揍,也要被人當成神經病。
而當我們和SIRI對話的時候,SIRI扮演的就是這個無辜的路人,因為我沒有蘋果,所以只能和小米聊兩句給大家看看

因為無法建立標準,就沒有辦法建立交流中所必須需要的邏輯,所以我們人認為再簡單不過的聊天,現有的電腦技術也根本無法實現。
但是,如果有一天,電腦真的可以做到了呢??
這並不是沒有可能,比如,電腦延伸出了無數外接攝像頭,將我們指定的所有場景都記錄了進去,並且可以進行嚴格的行為分析,那麼當我們指定了摸姑娘屁股這個行為,電腦就可以將其調用出來,只要有了標準,他甚至可以把那個手印直接呈現在你眼前。
到了那個時候
我們可能不再需要知識,因為每個人都有了一個無所不知的大腦。
我們也不再需要邏輯,因為他可以幫助我們將一切信息收集、整合、演算、實施。
我們不再需要情感交流,特別是姑娘們,她們隨身攜帶最棒的陪聊工具滿足精神需求,並且可以隨便用一根電動棒代替男人,單身狗將統治世界。
到那個時候,說什麼都晚了。
所以,如果哪一天你的SIRI和你聊了起來
請立刻撥打110,雖然這並沒有什麼卵用,
至少,我們還能想辦法,把她消滅乾淨。


是時候祭出這張圖了··


當初看完she的時候我也來過這麼一下~和最高贊那位比起來,顯然日系的更萌一些。


據說……


如果你看過《她》這部電影你就會知道有多可怕了。


我覺得未必。


其實是可以的


據說小冰被刻意降低了聯繫上下文的能力,防止有人愛上她。


那her這個電影里的故事就都實現啦!
大家都沉迷於siri,不結婚不繁衍,結果最後發現他(她)同時和800多個人在調情,然後人類因為繁衍能力下降滅絕了


應該看看疑犯追蹤,話說,好久沒看了,哪天追個劇去



人與人之間的交流那麼容易智能的話,為什麼還有那麼多宅男來知乎問怎麼和女生聊天?


因為沒做

要做的話會帶來很多問題,上下文信息是存在本機還是雲端?本機的話,它該向你學習什麼常識?什麼上下文信息?該存多少?什麼時候刪除?本機分析不出信息含義的話要不要傳到雲端機器學習然後分析?

如果存雲端的話?每個人存多少東西?隱私如何保證?

目前Siri僅限於分析語音、識別出一個請求然後返回數據而已。離真正的人工智慧差得太遠了。如果不用人工智慧而用通用的處理模板來模擬一個智能助手,首先和真正的智能還是差很遠,其次無法高度定製化,還是不能理解你的個人信息。

最後是隱私保證,這是個大坑啊,你如何信任智能版Siri不把你賣了?目前的Siri每次獨立的分析和請求都是完全匿名、互相割裂的,所以無法分析上下文。要是有一天他突然分析出來了,趕快退果保平安,天網要來了


誰說不能,這不是挺機智的嗎?


推薦閱讀:

未來 3~5 年內,哪個方向的機器學習人才最緊缺?
Deep Learning 的專家如此急缺,它難在何處?
如何看待人工智慧領域的很多專家認為「人工智慧將對人類存亡造成威脅」的觀點?
如何評價《羅輯思維》第 115 期對謝熊貓君翻譯的關於人工智慧的文章的重新演繹?
自然語言處理在 2017 年有哪些值得期待的發展?

TAG:iPhone | 人工智慧 | 自然語言處理 | Siri |