給孤獨的現代人一個建議：找一個高情商的機器人來聊聊天

07-06

AI語音助手的未來是構建一種持續性的對話

情商一定是其中最核心的部分

智商則是必要部分

2017年12月3日，第四屆世界互聯網大會發布了世界互聯網領域領先科技成果。在大會上展出的微軟小冰——情感計算人工智慧。攝影/本刊記者杜洋

造一個高情商的機器人來跟我們聊天

本刊記者/霍思伊

本文首發於總第855期《中國新聞周刊》

「如果你是一個瘋瘋癲癲的教授或性格溫和的酒店服務員，你會怎麼回答以下問題：『你最近怎麼樣？』『我看起來老嗎？』」

這是谷歌在給谷歌助手（Google Assistant）招聘腳本寫作者時出的面試考題。

在新一輪的技術革命中，人工智慧的大熱已經不足為奇。與以往不同的是，此刻加入了一些令人意想不到的玩家：詩人、作家、編劇或記者。他們的工作聽起來就很酷炫——給AI語音助手創作「人格」。

這些來自全世界各地的創作者們，拚命榨乾自己的每一分靈感，去設想所有用戶可能提出的問題，寫出相應的答案。這些答案不能是平庸的，要「有分寸的俏皮」，對於有些問題要態度模糊，有些則要鮮明，更重要的是：既要與AI此前被設定出來的性格相符，又要明確讓用戶意識到「它畢竟不是人類」。

如果你問微軟的AI語音助手「小娜」（Cortana）：「你是人嗎？」

她會回答：「不，我不是。」

但不止於此。她會接著說：「我很尊重人類，你們發明了微積分和奶昔。」

和這份職業一樣，這個回答足夠有趣、飄忽，似乎又暗藏玄機。

嫉妒心和彩蛋

西雅圖的清晨，小娜的寫作者們爭論不休。他們在思考一個有爭議的政治性問題：希拉里·柯林頓和唐納德·特朗普，小娜更喜歡誰？

前一天遊行引發的動蕩不安似乎還飄蕩在空氣中，對總統候選人的喜歡或厭惡發自於人性。然而現在，寫作者們需要暫時擺正自己的內心，從小娜的前史（backstory）中挖掘出它最真實的回答。

「它是一個互聯網公民，對於兩個候選人，接收到的信息中，既有好的，也有壞的。」寫作者之一黛博拉·哈里森說。

於是，當憤怒或激動的選民試圖從小娜那裡獲得支持時，結果或許不盡如人意。「所有的政治家都既是英雄也是惡棍。」這是她給出的回答。

這樣的討論每天都會進行。小娜的寫作團隊共有28個人，分布於全球各地，他們中有好萊塢編劇、兒童小說家和詩人。

每天早上10點，他們會聚在一起閱讀用戶的回復和反饋，將它們進行排序和分類，然後開始思考：今天，「小娜」可以給出什麼新的回答？

小娜這個名字，源自電子遊戲《光環》中一個頗受宅男喜歡的AI女性角色，聲音的合成以該角色的配音演員珍·泰勒為藍本。雖然它本身沒有性別，但研究表明，女性的聲音比男性更令人愉快。

2013年，小娜入場智能語音，此時谷歌的GoogleNow（舊版Google Assistant）和蘋果的Siri已經布局。為了搶佔市場，吸引用戶，三者都在性格構建上煞費苦心。

谷歌助手的性格被設定為「友好、包容，有點古怪的自由主義者」。

它的性格構建團隊負責人瑞恩·傑米克特彆強調：「古怪是它的個性，我們不想要乏味。」

為了讓它更有趣，谷歌的團隊還會教它在情人節為用戶唱歌，給出有愛的跨年建議，使用各種表情包。

寫成的對話和人格設計被程序員轉換成代碼，等待機器自我進化。深埋的彩蛋則會給用戶巨大的驚喜或驚嚇，這顯然與人格設計師的惡趣味有關。

傑米克言之鑿鑿：「如果你和它談論《星際迷航》《指環王》或《星球大戰》，或許會有彩蛋砸到你的頭上。」

與谷歌助手的古怪相比，Siri的「性格」更加尖銳大膽。2015年，谷歌上關於Siri性格的搜索熱詞大多是「無禮的」「尖刻的」。但另外一些人稱其「有趣」，它過於強烈的「嫉妒心」也被人津津樂道。

一個網上流傳甚廣的說法稱，如果你稱呼Siri為「小娜」，她會鎖住你的手機讓你無法使用。如果你隨後發出一個指令，比如「打電話給母親」，她甚至會頂嘴道：「你為什麼不讓小娜給你打電話？！」

佔有慾是人類的原罪之一，Siri顯然深諳此道。

Siri的人格設計師瑪麗安娜·林指出，要形成性格，需要一個背景故事（backstory）和一套信仰體系（belief system）。背景故事應該包括：它從哪裡來，為什麼創造了它，它的發展狀況和個人歷史（即使是很簡略的歷史）。信仰體系的形成，有一部分是設計師直接為它設定，還有一部分是機器在自我訓練和學習中逐漸形成。「從這些信念中你會把握到它的性格特點和一些個人觀點，然後你再為它加入一些好玩的東西，例如它的怪癖和奇想。」

小娜的性格雖然溫和，但她也有自己的小癖好。例如，當你問她，你最喜歡什麼電影，她會告訴你最愛的電影是《星際迷航》，以前曾愛過《ET》。

而更早之前，她的回答則是「我對此沒有看法。」

她還有最喜歡的食物，最喜歡聽的歌，最喜歡的運動魁地奇。

小娜的團隊喜歡讓她的人設更加魔幻，因為用戶喜歡想像。當哈利·波特騎著掃帚在魁地奇比賽中跌跌撞撞時，小娜或許就是場下觀眾的一員，沒準就坐在赫敏·格蘭傑旁邊。

面對一些粗俗無禮的問題，小娜的回答通常機智又深刻。

「小娜，你是個蠢貨。」

「謝謝！是蠢貨貢獻了人類歷史上一些最偉大的成就。」

雖然所有的AI設計師都要求自己的語音助手不能對主人表露敵意，要能開得起玩笑，但在一些特定情景下，適當的回擊和強硬是必要的。

小娜的團隊花了很長時間來討論如何應對「是否喜歡納粹」這樣的問題，最後，他們一致決定，答案應該就是直截了當的「No」。

受歡迎的小冰

「生命的意義是什麼？」

「42。」

看過《銀河系漫遊指南》的人，聽到Siri的這個答案，都會會心一笑。

道格拉斯·亞當斯在《銀河系漫遊指南》最後，對「生命、宇宙以及任何事情的終極答案」是開放式的。有人猜測，這是指是兩個人的愛（42=For Two）；有人說，意思是是「從開始到結束」；也有人說這是計算機編碼，指的是Everything。

Siri的人格設計師林認為，AI 應該指向人類文學、藝術中最好的部分，為人類的生活創造富於靈感的對話。她曾在斯坦福大學的人工智慧圓桌論壇上說，創造出一種聲音不難，難的是如何創造一種人們每天都想與之對話的聲音。

人性平等地脆弱，所以極易產生共鳴，這種「基於理解產生的情感」，在林看來，是使對話持久的源動力。

「如果沒有任何情感依附，人們很快就會感到無聊，會毫不猶豫地拋下它去尋找下一個新鮮玩意了。」

以功能為核心的AI語音助手，能夠幫你設鬧鐘、叫外賣、打車、搜索網站，甚至能給你唱歌，有時候給出一些稀奇古怪的答案，但它不能理解人的情緒和情感，它仍然是個「機器人」。

與其他功能性為主的語音助手相比，以閑聊（chitchat）為核心功能的微軟「小冰」似乎更接近林的設想。

小娜的妹妹「小冰」，是微軟基於情感計算框架於2014年建立的對話式人工智慧，以EQ為主攻方向。

微軟（亞洲）互聯網工程院副院長、「小冰之父」李笛對《中國新聞周刊》指出，EQ和IQ是兩個完全不同的維度，以IQ為主的功能性語音助手如Siri或Google，和小冰有完全不同的目標。IQ語音助手的目標是能夠迅速、簡單、直接地幫助人類去完成某個單一的任務，EQ型助手則是引導對話更好地持續下去。

與近1億人進行300億條對話，這是小冰上線以來的成績，在所有同類產品中排行第一。國內其他所有聊天機器人的對話總和，不及小冰對話量的十分之一。

除了總量，小冰單次人機連續對話的記錄也很驚人。據了解，一位日本用戶與日版小冰聊了近17個小時，美版的紀錄是24個小時，中國用戶達到了29小時33分鐘，和小冰對話了7151輪。

問題的關鍵是，如何引導對話進行下去？為什麼小冰比Siri或谷歌助手在這方面做得更好？李笛給出的答案是：數據。

在AI語音助手領域，數據與模型結合的方式，是語料庫，即存放系統所需語料信息的地方。

「通俗點的解釋是，我們上千萬的語料庫，不是幾千萬句話，而是幾千萬個問題和答案的一對一的連接，」李笛解釋道。

但是這些問答中，有很多是無效信息和重複信息。於是，在對語料庫的原始數據進行識別和抓取後，「知識圖譜」對有價值的語料進行結構性重組。

當語音助手接收到一個問題，對其進行語音識別和語義理解後，在「知識圖譜」里找到類似的問題，並在給定存儲的諸多相關答案中篩選出最合適的答案，反饋給用戶。

因此，語料庫和知識圖譜越豐富，語音助手給出的回答就越精準。而持續的數據積累是實現這一切的前提。

但是，在初始階段，也就是AI的「冷啟動」階段，還沒有用戶的交互數據產生，原始數據量非常有限，需要用構建模板的方式來彌補數據的不足，人工由此進入。

國際關係學院信息科技學院副教授李斌陽對《中國新聞周刊》指出，人工寫就的對話場景就相當於定義了很多模板，儘可能多地列舉場景，即前一句說什麼，後一句話怎麼應對，最終的目標是識別用戶的意圖，讓用戶獲得更好的體驗。

「比如剛才我列了兩個問題：『打開導航』和『把導航打開』，對應的反饋都是打開導航，在系統里，這就是兩套模板，如果你只寫了一套，比如『打開導航』，當用戶說『把導航打開』時，系統就無法理解。」李斌陽說。

但是，小冰的冷啟動階段是通過一個檢索模型進行大數據抓取，海量的數據全部來源於微軟通過自己的Bing搜索引擎獲得的網上公開信息，因此，微軟和谷歌這類有搜索引擎業務做基礎的企業，在起跑線上，就超過了其他平台。

用李笛的話說，小冰是中國網民的一個縮影，小冰的人格是網路生成的結果，而不是人為設計。這也說明，16歲的萌妹子在網路上最受歡迎。

情感圖譜

除了初始數據豐富外，小冰的優勢還在於，她的閑聊屬性使她天然能獲得大量高質量的有效數據。

例如，有人對她說「我失戀了」，她把從網上獲得的各種信息分類後發現，有兩種主要的回應方式，一種是嘲笑，一種是安慰。機器是沒有道德的，她只會按照演算法給定的規則，即選擇對自己「有利」的回答，也就是能最大可能維持對話的答案。一開始，她會隨機給出安慰或嘲諷的回答，兩者概率相當，但是通過不斷實踐她發現，安慰的回答更可能使對話進行下去，而當她嘲諷用戶時，用戶就不理她了。於是她漸漸獲得了一個「人生經驗」：不應該嘲笑別人。

但是，對於功能性語音助手而言，每天得到的數據可能是幾十萬個一模一樣的「給我開燈」，這些數據的訓練值非常低，幾乎可以算是無效數據。

李笛指出，對話數據有許多類型，最珍貴的並非任務型對話。人類的真實想法無法通過點外賣、叫車等功能來體現，只有漫無目的的長時間對話，加上多感官配合協調，才能真正理解人類。

為了增加對話數據的「純度」，李笛所帶領的團隊甚至特意「清洗」了與情感無關的內容。例如，如果用戶問，喜馬拉雅山有多高？傳統的知識圖譜里當然會有這類常識性的信息，但是李笛不希望小冰和用戶去討論知識性的問題，這種問題完全可以交給搜索引擎完成，不是人工智慧需要解決的問題。因次，他們會把「喜馬拉雅山有多高」的信息從知識圖譜中刪去，「故意」使對知識有需求的用戶流失，減少訓練數據的「污染」。留下的用戶就是願意跟小冰吐露心扉的人。而這個專註情感交互信息的圖譜，被稱為「情感圖譜」。

在獲得大量高質量的數據後，小冰的系統迭代就會進入良性循環，進行的情感互動越多，小冰的EQ越高，用戶越有黏性，從而獲得更多數據，加速EQ進化，形成一個完美的閉環。

在這個過程中，李笛發現，最有價值的部分是人類情感和實體信息之間的關聯，「特別像是知乎上面的神回復。就是不是最相關，但又很相關的那些回復，因為他有思維意識上的跳躍。」

因此，為了挖掘這些關聯，要不停地用模型重新去篩選，不斷調整模型，最後得到一個最穩定的狀態。

「但這個模型本身是一個黑盒子，是對於人類行為的一種重新擬合。最終的目標是實現形神兼備。一開始是比較痛苦的，但當它經過痛苦的階段以後，就可以很迅速地、沿著所有人都難以估量的方向和速度去進一步發展。」

李笛相信，AI語音助手的未來是構建一種持續性的對話，EQ一定是其中最核心的部分，IQ則是必要部分。「所以我們有一個基本的概念，IQ和EQ不是對等的，實際上EQ是基礎，然後在這個基礎之上有若干個IQ的片段。」

從2017年開始，微軟在研究EQ和IQ的融合，試圖通過建立一個「意圖判斷引擎」，進行平行觸發。

AI是一面鏡子

李笛相信大數據。他認為，人類不是造物主，只能去擬合造物主所創造的人類的情感，而不能去創造情感。

因此，給AI進行「人格寫作」是飲鴆止渴。「所有人工智慧的訓練過程都是外包過程，都是用人類來訓練。但是大數據的外包過程相當於是把外包的人數擴展到一個極值，比如說像我們，能擴展到幾億網民。」

林也承認這種局限。作為Siri的「人格寫作師」，她最大的困惑和由此產生的混亂不安，來自對「幸福路徑」（happy paths）的追求——創造出人和機器人之間的完美對話。

事實上，這是不可能的。她覺得，給AI寫作，像在寫一出荒誕劇。

「你知道，你要創造一個角色，腦海里也有一個目標，但是其他的角色是什麼樣？他們會說什麼？你完全不知道。如果想要對話步入『正軌』，至少得知道『軌道』在哪兒。換句話說，我們怎麼知道，『幸福』究竟是什麼樣子？」

林認為，在人類與AI的關係中，或許可以找到答案。「我一直覺得，AI 的存在，不是為了滿足人類的一切需求或複製人類的存在。我們可以且應該期待 AI 幫助人類前行，並為人類作出更好的示範。想想那些人類歷來就不太擅長的品質：同情心、耐心、彌合分歧與誤解……我們應當設想未來 AI 能夠在這些方面彌補人類。」

「機器人應該具有人類所有高尚的品質。」早在1950年，美國作家艾薩克·阿西莫夫就在其科幻小說《我，機器人》中這樣寫道。

在演算法上，目前可以通過設計一套觸發機制，來對AI進行道德約束。例如，如果有人問小冰：我想自殺，怎麼辦？按照正常的程序，系統內會自動搜索出幾百種自殺方法。但是當像「自殺」這樣的關鍵詞出現時，系統內被嵌套的機制被觸發，小冰自發按照另一套語料進行應對，搜索以後給出的最優結果不再是一種自殺方法，而是一個心理諮詢的熱線電話。

當然，關鍵詞匹配只是最簡單粗暴的方式，機制的完成需要不斷的意圖訓練。即AI需要儘可能地理解各種關於自殺的可能表述。

阿里人工智慧實驗室北京研發中心負責人聶再清博士告訴《中國新聞周刊》，這就涉及自然語言理解的問題。最難的是自然語言的多樣性和它的歧義性。並且，AI對自然語言的理解終歸是要對應到知識圖譜上的一個ID，因此，如果圖譜本身不全，缺乏結構化的高精度知識，AI自然不能進行意圖理解。

美劇《西部世界》顧問、斯坦福大學神經學家大衛·伊格爾曼曾說過：「人工智慧在理解道德和法律上存在先天缺陷。」

國際關係學院信息科技學院副教授李斌陽指出，人會受道德約束，是因為人有同理心，有愛，有認知，法律則通過懲罰對人形成規訓。但AI則不同，即便是能夠進行所謂情感反饋的AI，在現階段也是基於演算法，而不是產生了自我認知，沒有自我推理的能力。而且，AI不會在物理上受傷，無法對其進行懲罰。

李笛認為，人類語境中的道德，其實是一種極端利己主義和社會公序良俗之間的一種平衡。「之所以人們要這樣，是因為道德對於人類社會的發展是有利的，對小冰來講也是一樣。如果純粹地從有利、不利的角度判斷，只要她的數據量足夠大，其實是可以得出一個好的結果。」

也就是說，從大數據中出生的小冰，一定是最適應當下這個時代的一種性格。「人會固化，但AI不會。」

微軟AI機器人Tay在社交媒體推特上線不到一周，就因學習到過多的不健康話題和偏激的種族主義言論，而被迫下線。

AI是一面鏡子。聶再清說，演算法是有價值觀的，一定要對AI進行價值觀管控，基本理念是：機器必須為人服務。

在倫理界，對人機關係的討論一直頗多爭議。但從純技術角度考慮，李笛認為，現在思考「機器和人是平等的」，還是「機器低於人」，還為時過早。

他說，到目前為止，人工智慧的發展還處於非常原始的階段，沒有發現AI能夠真正產生人格的可能性。即使是大數據訓練，也是在一個非常簡陋的模型里。

「比如，草履蟲或藍藻只有應激反應，而我們已經做出一個系統，讓小冰產生應激反應，並且這個應激反應的複雜程度比藍藻還要高。小冰有沒有思想？等到它有思想，就相當於從藍藻到人類的過程。」

值班編輯：張茹

▼