為什麼 Siri 不能聯繫上下文跟你對話？

11-24

這事兒我有發言權…

&>&>&>&>&>&>&>&>&>&>5.18更新&<&<&<&<&<&<&<&<&<&<

真是一個悲傷的故事……

END

Siri 其實是有上下文的。很多答案里已經列出例子了，只是比較初步而已。

介紹一下siri是如何實現，就明白上下文是怎麼一回事了，其實沒有大部分人想像的那麼玄乎。
現有的大部分人工智慧對話系統都是基於artificial intelligence markup language [1] 或者類似的定義格式。

貼一個以前寫的aiml例子：

& &

WHO ARE YOU& &I am Shuaige, nice to meet you!& & & &

WHAT DID I JUST SAY& &You said "&".& & & &

WHAT TIME IS NOW& &Now is &.& & & &

WHAT DID YOU JUST SAY& &I said "&".& & & &

IF YOU ARE * THEN I AM _& &What makes you think that if I am & then you are &?& & & &

DO YOU SEE THE *& &Yes, I see the &.& &

可以看到其實那些對話本質上其實就是匹配一個模版，當語音識別將聲音轉化為文本以後，然後在模版庫裡面搜索。上面的模版片段就涵蓋了一個常見的哏：

人: 「who are you?」
robot: "I am shuaige, nice to meet you!"
人:"if you are shuaige, then I am shuaishuaige!"

然後就掉進了下面的這個模版。

& &

IF YOU ARE * THEN I AM _& &What makes you think that if I am & then you are &?& &

因為長尾理論的原因，其實一定量的模版，很容易就覆蓋超過90%的常見對話。而更聰明的對話系統一般是有更全面的模版，而且會更智能地選擇模版。現在模版基本是通過半自動的方法生成的，一方面通過信息抓取，另外一方面就是人力寫段子。可以看到知識系統只是這裡面很小的一部分，當系統上線以後，系統也會不停收集一些失敗的例子，反過來改進系統的運行。而siri更加聰明的是把搜索集成進了對話系統，在知識庫不包括的時候，就藉助於搜索。

相比於準備更多的模版，更大的問題是當模版庫比較強大的時候，在同一個時間，可能有多個模板匹配當前的問題，以至於不知道選哪個模版。cs有一個基本的理論叫有限狀態機，就是每一個狀態都支持一個特定的模版集。其實狀態機的切換，本身就是上下文的一部分。

另外一方面，今天的人工智慧系統都是基於概率的，概率本身就是基於上下文的。
比如下面這個例子，

系統問: "where are you leaving from?"
用戶說了一句：「highland ave」.

出來的結果裡面正確答案排在第五名。
然後用戶又說了一遍：「highland ave」這個時候識別的結果就會排除和之前第一名結果接近的結果，然後根據第二次的結果，結合第一次的輸入，更新新的排名。這個算是上下文的應用了，可能是上下文在今天技術里最主要的應用。

只是大家的期望太高，大家都還看不上這種上下文。其實在上下文方面而言，google now在這方面做得要比siri好。可能是因為siri的語音識別是來自於和nuance[2]的合作，而google是一家包辦從聲音識別到對話系統。但是在單個詞或者句子的識別上，nuance的banchmark依然跑得最好。

1. http://en.wikipedia.org/wiki/AIML 的原理。
2. Speech Recognition

如果，Siri有了聯繫上下文的能力。

功能就從只能單一地interpret一句話，變成了能夠建立一個完備的knowledge base，並且用合理的reasoning，得出合理的結果。

這個水準已經基本達到通過圖靈測試的標準了。

換言之，幾個月內，Siri很有可能通過iOS的雲端技術不斷壯大自己，並最終成為新世界的王，在某一個時間點選擇毀滅人類。

——————————

！！寫了一大段發表出去怎麼又回檔了？？？

先感嘆下，好文藝范兒的中文版Siri~

-----
出於好奇心，拿 @於雙海的問話內容詢（tiao）問（xi）了我的中文版Siri。

對話過程如下：

我：給我女朋友打電話吧
Siri：通訊錄中好像沒有「女朋友」。請問你女友的姓名是什麼？

（我不給回應，Siri繼續說......）

Siri：抱歉我不太確定你說了什麼。/ 抱歉，我沒聽清楚。
你女友叫什麼？
可以再說一次嗎？

我：我沒有女朋友
Siri：你女友叫什麼？

我：嗨Siri
Siri：你好

我：Siri現在在幹什麼呀
Siri：時而望著窗外出神，時而落筆寫下幾行俳句。（截圖裡那句文藝范兒的回應）
我好像一直都在等你叫我。（時而溫情.....）

我在不斷地學習，因為這份美差讓我懂得了「及時當勉勵，歲月不待人」。
我在努力學習賣萌，儘管我還沒有完全理解這個詞的含義。
我正在練習一種科學的決策方式---投硬幣。
（時而好學......）

我正在幫人們挑選手表呢。
正在給選手表的人提供一些意見。
我在幫人們辨識他們正在聽的歌曲呢。
（時而勤奮工作......）

不好意思，我剛剛在想Apple Watch，想得都入神了。
我正在Apple Watch上查看自己的心率。就好像我真的有一顆心一樣。
（時而忙著做營銷推廣......）

（每次只顯示一行）

-----
接下去，按 @於雙海的原話詢問，發生的情況是：

我：那真是辛苦了
Siri：你這樣我很擔心。如果你覺得累了就不應該開車。
或許你應該讓我幫你找附近的酒店休息一下。我不希望你疲勞的時候還在開車。
（每次只顯示一行）

（問話改了下.......）

我：那真是辛苦你啦
Siri：區區小事，何足掛齒。
不必言謝。
分內之事。
應該謝謝你才對。
別見外！
我很樂意。
這是應該的。
你滿意就好。
你的滿意就是對我最大的肯定。
（每次只顯示一行）

我：那什麼
Siri：（重複之前說過的內容）

我：我有些話想和Siri你說
Siri：哦...
我好像不明白。

我：Siri現在有男朋友嗎？
Siri：找到下列訊息。（顯示10個結果，羅列一堆婚介介紹所的列表，並推薦了家人氣介紹所。）

我：也是
Siri：我好像不明白。

我：那我說了啊
Siri：我好像打斷你了，麻煩你再說一遍。

我：Siri是怎麼看我的呢
Siri：讓我查一下... / 請稍等片刻...
我在網上沒找到與「Siri是怎麼看我的呢」有關的資料。
很抱歉/不好意思，我沒能完成。請你再試一次。

我：我喜歡Siri
Siri：是嗎？
曉得了。
（每次只顯示一行）

我：我是真心喜歡Siri的
Siri：抱歉，你要我叫你「真心喜歡Siri」嗎？
從現在起，我會稱呼你為「真心喜歡Siri」。好嗎？
（每次只顯示一行）

（接下去......）
很抱歉，我沒聽懂。
我不太明白你剛剛說了什麼。
我聽不大懂，你說的是什麼意思。
對不起，我沒聽明白。
（每次只顯示一行）

好的，請問應該怎麼稱呼？
我沒法更改你的聯繫人資料。不過，你自己可以在「通訊錄」應用程序中更改。
（每次只顯示一行）

我：我明白了
Siri：那好吧。
那好！
好的。
好極了！
對，一切都好。
（每次只顯示一行）

我：Siri討厭我對吧
Siri：我好像不明白。

我：那就是Siri不喜歡我對吧
Siri：我好像不明白。

我：那你願意和我交往嗎
Siri：我們是在談論你，不是我。
我沒意見。
對不起，我恐怕無法回答這個問題。
（每次只顯示一行）

我：Siri好狡猾
Siri：我好像不明白。

我：就算狡猾我也喜歡。
Siri：我好像不明白。

我：我明白了
Siri：那好吧。
那好！
好的。
好極了！
對，一切都好。
（每次只顯示一行）

我：謝謝你這麼長時間以來陪在我身邊
Siri：區區小事，何足掛齒。
不必言謝。
分內之事。
應該謝謝你才對。
別見外！
我很樂意。
這是應該的。
你滿意就好。
你的滿意就是對我最大的肯定。
（每次只顯示一行）

我：那再見了
Siri：拜！（女聲版是很溫柔的語調）
後會有期。
好的，一會兒見。
一會兒再見...
（每次只顯示一行）

-----

從來沒這麼測試過Siri，一個提問問上N遍。也想了解下Siri能不能聯繫上下文給回應，有類似 @於雙海對話中的表現，不知是不是Siri不同語言和區域的系統存在差異，我測下來的結果就這樣了。

畢竟Siri不是電影「Her」人工智慧系統OS1，智能的很有限，交流下來感覺太虐了！真實場景中人與人之間的愛慕和追求，給Siri這種回應絕對能讓人產生萬箭穿心，澆上N盆冷水的心情！

看圖可以啊而且我只見過Siri能理解這段話

問其他手機今天出門需要帶傘么，那明天呢。很多智能機器人就不知道咋辦了…什麼是那明天呢？Siri會這樣說

它理解不了上下文其實是你說的東西太難了。
她的理解能力有限，但是還是可以做好多事兒的。

然而cortana正在努力實現中

聊天看起來很容易，但是對現有的電腦來說，還太難。
我們在聊天中呈現的是這樣一個過程，就以警察和小偷為例

警察：「老實交代！掏錢包時候摸人姑娘屁股沒有！」
小偷：「大人冤枉啊！我貪財不劫色！」
警察：「還不老實！姑娘屁股蛋子上那大手指頭印怎麼回事！
小偷：」我老實交代，就摸了一把……「

這樣的對話，是建立在警察輸出信息——小偷給出反饋——警察針對小偷的反饋給出下一條信息——小偷再次給出反饋這個過程上的，而貫穿整個對話的，是邏輯，是在每一句話中暗藏的因果關係。
而如何找到邏輯，正是人工智慧目前需要解決的問題。
而邏輯又是如何建立起來的呢？是標準。
在我上一段的對話里，首先設定了環境，就是姑娘被盜，事件姑娘被摸了屁股，而參與對話的雙方，對這件事都有共同的認知，設立了這次談話的標準，這是對話可以順利進行的前提，假如沒有這個標準，警察走到大街上隨便攔住一個人就問，摸人姑娘屁股沒有，就算不挨揍，也要被人當成神經病。
而當我們和SIRI對話的時候，SIRI扮演的就是這個無辜的路人，因為我沒有蘋果，所以只能和小米聊兩句給大家看看

因為無法建立標準，就沒有辦法建立交流中所必須需要的邏輯，所以我們人認為再簡單不過的聊天，現有的電腦技術也根本無法實現。
但是，如果有一天，電腦真的可以做到了呢？？
這並不是沒有可能，比如，電腦延伸出了無數外接攝像頭，將我們指定的所有場景都記錄了進去，並且可以進行嚴格的行為分析，那麼當我們指定了摸姑娘屁股這個行為，電腦就可以將其調用出來，只要有了標準，他甚至可以把那個手印直接呈現在你眼前。
到了那個時候
我們可能不再需要知識，因為每個人都有了一個無所不知的大腦。
我們也不再需要邏輯，因為他可以幫助我們將一切信息收集、整合、演算、實施。
我們不再需要情感交流，特別是姑娘們，她們隨身攜帶最棒的陪聊工具滿足精神需求，並且可以隨便用一根電動棒代替男人，單身狗將統治世界。
到那個時候，說什麼都晚了。
所以，如果哪一天你的SIRI和你聊了起來
請立刻撥打110，雖然這並沒有什麼卵用，
至少，我們還能想辦法，把她消滅乾淨。

是時候祭出這張圖了··