聊天中的情感分析有多難?

本題已收錄至知乎圓桌:人工智慧 · 語言智能,更多「人工智慧」相關話題歡迎關注討論


聊天不同於陳述!這背後涉及到一個本質的區別——「是否有交互」。一旦涉及到交互,情感分析(sentiment analysis)評判標準的複雜度就要上升不止一個數量級了。現有回答都說的是陳述性文本的情感分析。

Affective Computing」(情感計算)和NLU是AI領域重要的研究方向,而其中針對中文的情感、情緒識別與理解,竹間智能已經做了許多研究與探索,希望幫助AI在語義理解的基礎上更進一步,實現真正的人機情感交互。此次我們邀請 竹間智能高級演算法工程師 鄧霖 ,來深入地分享一些竹間在中文情感、情緒識別上的經驗,並從技術,商業,人文等多個角度談談如何在對話中判斷和利用情感,以及情感判斷的重要意義。希望對大家有所幫助。

本文行文結構如下,共分為三個部分:

一、 無交互的情感分析,其普遍的技術實現方式及商業應用 二、 互動式情感分析的難處和解決思路 三、 情感在人類信息溝通中的意義和作用,以及如何應用

一、無交互的情感分析,其普遍的技術實現方式及商業應用

1. 無交互文本情感分析的普遍技術實現方式

情感分析(sentiment analysis)又稱傾向性分析,意見抽取(Opinion extraction),情感挖掘(Sentiment mining),主觀分析(Subjectivity analysis)等,是對帶有情感色彩的主觀性文本進行分析、處理、歸納和推理的過程。

目前,情感分析在傳統機器學習上的主要研究方法還是基於一些傳統演算法,例如,SVM、信息熵、CRF等。基於機器學習的情感分析,其優勢在於具有對多種特徵建模的能力。要用人工標註的單個詞作為特徵,而語料的不足往往就是性能的瓶頸。

當然也有基於情感詞典的情感分析方法,也就是應用情感詞典中記錄的詞語或短語的情感傾向程度和強度信息對文本進行情感分類。這個就比較依賴於人工構建和抽取的特徵了。會受到情感詞典本身的質量以及適用領域的局限,否定詞也是一個小坑。(構建情感詞典一般採用bootstrapping的方法)

至於深度學習在情感分析上的種類就比較多了,有各種方法的綜合創新,比如有利用LSTM結合句法分析樹,還有基於卷積神經網路和支持向量機的。除了準確率能有明顯的提高外,重要的是可以自動從無標註的文本中學習文本中的隱藏特徵,並可以實現端到端的分類。

這些技術也並不獨立,往往都是混合使用,以此來取長補短,從而達到一種相對均衡的效果。

2. 無交互的文本情感分析的商業應用

  • 情感分析最大的應用層在於評論的篩選和歸類,之所以這個應用最廣泛,就是因為第一這個應用離商業價值很近,第二不需要做到特別深,很多時候只要做到正負分類就能產生可見的收益了。比如對於一個餐廳來說,能夠做到把關於自己的相關好評自動抽取並在自己的網站輪播也許就夠了。

電商平台里關於商品評論的標籤提取也可以說是情感分析。

關於評論的情感分析,再做深一點就是意見挖掘,這就涉及到關聯規則了。也就是做得更細,能看到用戶到底是對產品的哪個屬性滿意或者不滿,比如我覺得這件衣服有色差或者材質不夠好等。

再做好點就是能把情感的強度表示出來(強正面,弱正面,中性,弱負面,強負面),以及增加情感的分類。

也可以反向思考,利用情感分析評論,做用戶的分類聚類。

  • 還有一個應用是預測社交網路上的輿論走向。美國大選那段時間,情感分析發揮了至關重要的預測作用,通過利用Twitter上的大量文本進行分析,來預測整體的輿論走向。這也是在傳統調查都顯示特朗普會輸的時候他卻表現得穩如泰山的原因。

這方面自己做得好玩的話,可以爬爬社交網站中熱門事件的回答和評論,然後分析分析輿論的走向,說不定就成了一個PR的專業分析產品了呢。還可以看看有多少輿論問題是從網站中炒起來的,企業還是相當在乎相關輿論的走向的,畢竟輿論錯位導致的用戶認知改變不是隨便砸錢就能扳回來的。所以要是實現了高準確率的預測,對於企業來說,或許可以一定程度上做到防患於未然。

  • 以上這些都算相對直接的應用。其實間接性的話,情感分析的偏向性判斷對於構建較深層的個性化推薦系統有著比較大的幫助,能較好地理解對於不同種類商品以及不同屬性的偏好程度,從而具備一定的符號推理能力,相對於目前無論是按 item CF、user CF 還是隱語音模型方式的推薦系統都更具有可解釋性與理解力。

當一點點逐步知道了偏好傾向性後,其實關於用戶的精準建模也就慢慢清晰了,從多個偏好中還能進行進一步的挖掘來推理用戶屬性。一個深刻的用戶模型能產生的商業價值是不言而喻的。當然關於用戶的建模目前的研究也不多,基本是個藍海,我們正在嘗試去實現,從文本中不斷收集用戶的偏好、屬性等,再進行進一步的挖掘和推導。這邊先不展開了,以後會有文章展開細說的。

二、互動式的文本情感分析

上面說的其實都是「0交互的情感分析」任務。

都是以單人敘述的方式,可能是短句子也可能是一段話,都有一個核心共同點——「沒有交互」。

所以相對而言比較容易,只要按無交互的敘述方式做解決方案就好:就像分析微博一樣,去判斷這些短文本就行了,然後再增加一個持續的情緒疊加和衰減的函數就可以了。

不過似乎這樣做下去能夠帶來的價值還遠遠不夠。

這裡要明確幾個問題:

  • 情感在人類信息交互時的作用是什麼?
  • 知道了情感狀態後能幹什麼?
  • 怎麼最大化地利用這些信息創造價值?

一直相信一句話——「問題比答案重要」,知道問題是第一步,尤其是在不確定性這麼高的時代下。

這三個問題其實需要站在更高的層面去思考,也就是首先要從情感在人類信息溝通中的意義開始思考,再推理出怎麼應用,以及怎麼更高效率地運用。這些問題稍後來探討,我們先來看看有了交互後的情感分析會有什麼變化?

為什麼一旦有了「交互」,情感分析就變得那麼難?

第一:交互是一個持續的過程而不是短時固定的。而這從本質上改變了情感判斷的評價方式。在無交互的時候,比如商品評論,你判斷這段話是什麼情感分類後就可以實現價值了,是清晰的分類任務。但用在對話上就不太一樣了,情感狀態持續在變,分析任何單一的一句話是沒有很大意義的,這不再是一個簡單的分類任務了。對於持續的過程,簡單的解決方案是加一個增益和衰減的函數,但這個函數怎麼寫?理論依據是什麼?怎麼判斷這個函數寫得好不好?難道靠人工標註的數據去分析么。

第二:交互的存在將大部分的狀態信息都隱藏了起來。在明面上能看到的不到5%,只是冰山一角(用類似於隱馬爾可夫的方式去理解)。並且交互的雙方都默認對方知道很多信息。比如溝通主客體之間的關係狀態、彼此的需求目的、情緒狀態、社會關係、環境、之前聊到的內容,以及都具備的常識,性格,三觀等等。

然後你會發現以下一些現象:

  • 兩個人之間共同的信息越多就越難,因為隱藏狀態的作用越大,隱藏狀態的維度越多。
  • 不同的人之間存在著不同的交流範式。

這個範式的變化取決於其他的各種環境信息(包括時間,地點,你們的關係狀態,彼此的情緒,共同的經歷,自己的聊天習慣等等)。

即便是相同的人,他們之間的交流範式也是一個動態變化的過程,這個想必大家深有體會,比如兩個人在戀愛的過程中,他們之間的交流方式會因為感情的升溫和降溫而有所不同。

回想幾個生活中實際的經歷:

  • 找到一個微信對話,回想一下,在具體聊天的時候是不是都涉及到了這些隱藏的狀態和不同的範式。
  • 當你在和你覺得重要的人聊天的時候,是不是非常關心對方的情感狀態,而且需要推理這個狀態。

第三:交互涉及到信息的跳躍。當你自己一個人說什麼的時候往往都是比較有邏輯的,連貫的。但聊天和個人陳述完全是兩件事,聊天會有較大的跳躍性。這種不確定的信息跳躍性指數級地增大了情感分析的難度。

這就是為什麼加入了交互因素情感分析變得這麼難判斷的原因,首先是評價方式改變了,而且這個評價方式很複雜,沒有什麼可借鑒的。再從第二第三原因可以看到,這對於機器學習來說數據維度太稀疏了(顯性的狀態就只有文本,表情等,多數狀態都是隱藏的),再加上跳躍性,因此這種靠統計的方式,想把準確率做高,其困難程度可想而知。

因此要想突破瓶頸,就需要在這三個問題上找解決方案。

舉個例子,第一個問題,我們目前的評價方式的理論依據是心理學和認知科學的理論,當然這個還在探索。第二個問題,既然是缺,那就補,想辦法找到更多數據輸入進來,多維度(圖片,表情,顏文字等)的語義理解是一個思路,即多模態分析的思路。第三個問題,暫時屬於好像沒頭緒的狀態,結合知識圖譜和符號規則,這是一件看似簡單卻無比困難的事情,可能會有各種阻礙。

下面我簡述一下目前關於第二、三個問題稍細緻點的解決方案。

提到問題的解決方案,會比較自然地想到通過LSTM來解決上下文記憶問題,只是效果不太好,原因第一是大部分隱藏狀態不出現在文本里,第二是交互對話信息的跳躍,這導致LSTM的記憶其實作用不是太大。但相比其他方法確實LSTM在對話中的效果是有顯著提升的。

比較新的方式是:Seq2Seq模型上加情感向量,將情感狀態放入LSTM再加入情感詞加權生成回復。

進一步的話,可以利用NLU語義理解,從文本中抽取重要的實體和意圖,作為特徵加入到學習中,並且加上一套規則,結合用戶的建模模型後再輸出最後的對話語句。

繼續深入的話,其實就是找到隱藏的信息狀態並加入到計算中,也就是多模態,內部的多模態設計,emoji+照片+表情包+文本長度等等,外部的多模態就是加入了識別的面部表情+給我提供的標籤(比如性格,星座,愛好,年齡,性別等等)+語音等等。利用這些信息的規則其實也相當重要,更多的靠的是對人性的理解。

目前竹間智能正在努力做好第二和第三步,即更深的語義理解和多模態情感分析

三、情感在人類信息溝通中的意義

上一部分講到了互動式的情感分析的困難。那既然那麼困難,為什麼還要做?

答案是:因為這很重要。

人類進化的歷史本質就是通信的進化歷史。而情感在信息溝通中扮演著至關重要的角色。理解情感對於人類個體和人類社會的意義,才能做出懂人的產品。

  • 情感本身是高級智能的一部分

情感是大腦運行資源的調配者,不同的情感狀態下大腦的計算資源分配方式差距巨大,因此會採取完全不同的思維執行路徑。

情感對於人們的智力、理性決策、社交、感知、記憶和學習以及創造都有很重要的作用。

  • 情感是交互的核心

想必大家應該聽過這句話「人類交流中80%的信息都是情感性的信息」,雖然不一定足夠嚴謹,但自行體會生活點滴也會發現,情感是交互的核心。

對於個體的來說,我們在交流中表達情感,很重要的一個作用就是通過情感告知對方我現在的狀態,一方面給出對於之前交互的狀態反饋,另一方面讓對方能推斷出我接下來行動的傾向性。

為什麼不是內容而是情感,能傳遞最多的狀態信息?

因為從認知科學的角度來看,上面說過情感就是智能的一部分,情感就是大腦運行資源的調配者,不同的情感狀態下大腦的計算資源分配方式差距巨大,因此會採取完全不同的思維執行路徑,從而產出最後不同的結果。就像在和朋友對話的時候,如果語氣語調有了明顯變化,大腦就會迅速運轉來做出各種判斷,從而相應地改變自己的行為。千萬年的進化使得我們判斷的準確性很高,不斷的正向反饋也使得我們越來越依賴用識別對方情感的方法來判斷行為傾向這個方式,而且已經成為自動運行的認知方式了。這就是為什麼接近80%的信息都是情感信息的原因了,因為信息量高,極大地增加了溝通效率。

溝通效率提升的結果就是——增加了群體之間協作的廣度(協作者的數量)和深度(協作內容的複雜性)。群體智能得到了指數級的提升。

在「我現在的狀態」中「情感狀態」是信息量最大的狀態,通過這個我們可以做兩件事,第一是預測接下來對方的行為傾向,第二就是可以結合狀態來改變反推別人想了些什麼以及別人需要什麼。

  • 人類在交互中的情感帶寬

先提一個概念——「情感帶寬」,即你能表達的情感的信息量的大小和維度,比如說情感性的信息,往往是從多維度表達出來的,(口語:語音語調,語速,聲音大小;身體語言:面部表情,手勢,其他身體動作)等等,舉例如「最是那一眼的溫柔」「眉目傳情」「沉悶的乾咳」等等。

到了網路,整個範式就發生了比較大的變化,情感的帶寬也變了。比如在網路上交流溝通,我們的情感帶寬好像瞬間驟降了,需要以文本和圖片的方式來表達。

實際上在降低的同時,我們的情感帶寬在某種程度上也增加了,增加了幾個新的輸出維度,比如emoji表情、各種表情包、gif圖,回話的時間快慢,正在輸入的狀態,甚至像Faceu那樣的個人表情包等等都是不斷豐富我們情感帶寬的方式。

社交網路上的聊天,文字對話佔據了大部分,但實際上我們看到文字的時候其實是在大腦里虛擬者那個人在說的,會自行腦補Ta這麼說的時候的語氣和表情等等。

文字文本依然是佔據大部分的,而其他維度信息的縮減其結果就是——通過語義來推斷情感。

前面講到對話中情感分析的困難,其中一個重要原因就是因為信息維度的稀疏,因此要儘可能從多維度把缺失的情感帶寬給補上。

解決方案上面也說過了,多模態,內部的多模態設計emoji+照片+表情包+文本長度等等,外部的多模態就是加入了識別的面部表情+給我提供的標籤(比如性格,星座,愛好,年齡,性別等等)+語音等等。利用這些信息的規則其實也相當重要,更多的靠的是對人性的理解。

總結

以上講到了情感識別在交互中至關重要的作用。

對於整個情感交互來說,情感識別可以說是技術基礎,在識別之後可以做更深入的事情,「情感表達」、「需求分析」、「深度用戶建模」「人性化交互體驗」等等。

拿深度建模來說,通過和你聊天,就可以用情感分析對實體進行高效率的自動化標註,實現專屬情感詞典。了解到你的偏好以及你的偏好程度,利用你的偏好給你建模,久而久之就實現了個性化,而不是像Siri那種號稱個人助手實際上卻不夠個性化的存在。

對情感表達來說,可以實現人機對話系統中情感的誘導,判斷出情感之後自然就可以去影響情緒了,用不同的話語來實現情感傾向的改變。比如我能判斷我接下來說選哪一句答覆能讓你產生一個情感傾向,可能是高興、驚訝也可能是傷心等等。讓你產生感受這就是進一步在實現交互。

人性化交互體驗的應用方向是不言自明的,當智能體的「智商」沒有過於顯著的差別的時候,一個稍微有些情商的智能系統更容易被選擇。拿家用機器人來說,核心的需求其實是陪護和娛樂,而要做好這兩件事「情商」是關鍵。上面也說過情感是信息交互中最重要的反饋,因為信息量最大。因此一個不能很好地理解人類情感和意圖的機器是做不好交互的。當然要實現這個需要的是一整套的情感系統。

本回答來自竹間智能高級演算法工程師鄧霖。


題主問的是如何識別出一段文字的意圖或者情緒(例如是正面的還是負面的),這確實是一個技術上的問題。現在確實有一些演算法,可以在某種程度上做到這一點。這種演算法叫情緒分析(sentiment analysis),在 Udacity 的深度學習基石納米學位中也有介紹。

如果我們使用某一類文本訓練演算法,在相同類別的環境下,演算法的準確率可以達到 80%,甚至 90%。但是如果改變了環境,演算法的準確率就會大打折扣。例如,如果你形容你的襪子「暖和乾燥(warm and dry)」,我們這段文字的情緒一定是正面的。但是如果用同樣的詞語(又熱又干)形容壽司,情緒就會變成負面的。

所以我們在一種環境下訓練出的演算法,在另一種環境下可能會表現很差。至於諷刺,就更難檢測了,哪怕是我們人類,有時候也會判斷錯誤。

因此,我認為這個任務並不容易,但是也不算難。因為我們的演算法一直在改進,接近甚至超出人類的表現(因為在這類任務中,人類的表現也不能保證100%正確)。與深度學習的其他應用領域相比,這算是一個難度中等的任務。


判斷文字聊天中的感情,可以看作是情感分析。之前已有的一些情感分析的研究,主要有兩種方法。一種是基於詞典的方法,基於詞典的方法主要在於詞典的質量的好壞,此外,還有一些本身就帶有歧義的詞,不能夠簡單判定是正面的或者負面的。另一種是基於機器學習的方法。基於機器學習的方法主要是有監督學習,即要找一些類似的聊天語料來對機器進行訓練,使得機器能夠正確地判斷文字中的感情。在訓練集上達到足夠高的準確率,才有可能在實際測試的時候,準確地預測情感。此外,目前機器能夠區分的感情並不多,之前研究的區分的情感,大多是正負兩極,或者五級(負面、輕微負面、中性、輕微正面、正面)情感。人類情感的複雜程度遠超出這五種,因此如何識別人類的複雜情感也是機器需要研究的課題。

但是隨著演算法的不斷改進,在不久的將來,相信機器的準確率能夠達到比人更高。


可以。

情感分析的實際難度,可能比大多數人想像的低。

以英語為例,python的nltk已經能分析文本中情感的強度,在你的電腦上也可以輕鬆運行。

直接上代碼(參考鏈接:Sentiment Analysis)。

from nltk.sentiment.vader import SentimentIntensityAnalyzer
sentences = ["VADER is smart, handsome, and funny.",
"VADER is smart, handsome, and funny!",
"VADER is very smart, handsome, and funny.",
"VADER is VERY SMART, handsome, and FUNNY."]
sia = SentimentIntensityAnalyzer()
for sentence in sentences:
ss = sia.polarity_scores(sentence) # 這是一個dict
print(ss)

用nltk的情感強度分析,可以得出類似以下的結果(更多的例子,可以參考上文的鏈接):

compound表示複雜程度,neu表示中性,neg表示負面情緒,pos表示正面情緒

Very bad movie.
compound: -0.5849, neg: 0.655, neu: 0.345, pos: 0.0,
VERY bad movie.
compound: -0.6732, neg: 0.694, neu: 0.306, pos: 0.0,
VERY BAD movie.
compound: -0.7398, neg: 0.724, neu: 0.276, pos: 0.0,
VERY BAD movie!
compound: -0.7616, neg: 0.735, neu: 0.265, pos: 0.0,
Most automated sentiment analysis tools are shit.
compound: -0.5574, neg: 0.375, neu: 0.625, pos: 0.0,
VADER sentiment analysis is the shit.
compound: 0.6124, neg: 0.0, neu: 0.556, pos: 0.444,
Sentiment analysis has never been good.
compound: -0.3412, neg: 0.325, neu: 0.675, pos: 0.0,
Sentiment analysis with VADER has never been this good.
compound: 0.5228, neg: 0.0, neu: 0.703, pos: 0.297,
Warren Beatty has never been so entertaining.
compound: 0.5777, neg: 0.0, neu: 0.616, pos: 0.384,
I wont say that the movie is astounding and I wouldnt claim that the movie is too banal either.
compound: 0.4215, neg: 0.0, neu: 0.851, pos: 0.149,
I like to hate Michael Bay films, but I couldnt fault this one
compound: 0.3153, neg: 0.157, neu: 0.534, pos: 0.309,

對於日常的普通句子,nltk的情感強度分析器已經能很準確地分類。

情感分析模型的準確程度,往往取決於數據量。如果一種表達情感的語言方式被普遍應用,那麼在極大的資料庫中,一些基本的統計規律(即使是最基礎的n-gram之類)也會有意想不到的精確度。比如,「呵呵」一詞原本是中性,但是作為貶義被用得多了,統計模型也會自動發現它的負面含義。

諷刺和反語的難點在於,它們是更高層次的語意抽象。同時,識別出諷刺還需要現實世界的常識,畢竟諷刺的核心在於「預期」與「現實」的不符合

當然,情感分析(sentiment analysis)只是自然語言處理(NLP)的一小部分,NLP整體仍然非常有挑戰性。

最後,人都做不到的事情,我們無法保證AI可以做到。人能進行圖象識別,所以經過合適的工程設計,卷積神經網路的圖像識別準確率已經超過人類。反例也很簡單:猜隨機數,如彩票號碼。沒有任何已知的人類手段,能夠足夠準確地預測出下一個彩票的中獎號碼,所以讓AI去猜彩票號碼只會過擬合。如果大多數正常人都完全無法理解某一個句子的某種情感含義,那麼讓AI去分析這個句子,也是徒勞無功的。


「哦,行吧。

沒事那就晚安了。」

如果這種情況機器能做得比人好,那可以說是有助人類繁衍後代了。


我覺得機器人可以拋開人類的感情因素,一切都做最壞的的打算,用最好的心態去跟人類聊天,這樣可以讓心情不好的人心情慢慢好些,


夠嗆。我女朋友不同時候,說不同的「哦」字。區別多著呢。何況我了解了她兩年多才能做出這種判斷。


不能,不同人的同一句話以及同一人不同時間說的同一句話意思都是不同的,人類都區別不了,你讓目前的計算機怎麼區別呢


「我想去你家」

「別呀,我家沒人」

然後她家真的沒人...

「別這樣,停下」

遂停之。

「......」

人有時候自己都分不清別人在說什麼,或者自己要表達什麼意思。就像小說里的,三分嫉妒兩分恐懼一分羨慕三分憤怒外加一絲說不清道不明的感覺。這種東西來表達一個,誰能演出來我奉為神明。但是事實上有時候情緒這種東西你始終是找不到描述詞的,還是小說里那種描述,只不過要改成三分嫉妒,七分說不清道不明的意味。

人自己都無法判斷對錯,所以你幫他判斷出來的結果就沒有衡量標準了,那結果又怎麼知道對錯呢?去問發言者?如果問發言者又會出現心理暗示的問題,而且發言者也不一定選的就是心中所想的。所以計算機最多能進行簡單的情緒偏向分析,或者藉助強大的資料庫來知道對方所說的意思(例如術語)。但是說比人更強的情緒分析,比肩人的情緒分析都夠嗆

看不透人心,更看不透自己的心啊...

結論:短時間不可能。


最近恰好在給京東做新聞和微博的情感分析,包括不帶目標的情感分析與帶目標的情感分析。發現這確實是一個難度極高的問題,基本算是自然語言處理領域內最難的問題之一了吧(筆者認為,計算機實現了真正的情感分析,基本就實現了真正的自然語言理解)。首先,不同語料,例如新聞和微博,表達形式完全不一樣,計算機很難在不同形式的語料上學到一個通用的模型;其次,針對不同目標,要想實現帶目標的情感分析,難度也較大!歡迎感興趣讀者關注微博「夏日優弧」進行自然語言處理相關問題更詳盡討論!


人在聊天中的感情判斷是基於一個人全部的生活經驗的。這些生活經驗中不同的場景對應不同的記憶和情緒。機器哪有這些生理基礎?

跟一個喜歡吃蛇肉羹的人談論蛇,和跟一個小時候被蛇咬過有心理陰影的人談論蛇,得到的信息反饋很難相同。電腦沒吃過蛇肉,也沒被蛇咬過,怎麼能得出和人一樣的感受?


有祖傳經典段子:

不!要!停!

還有 死傲嬌

還有嘴上說著不要,身體卻很誠實。


針對某種語言對話,建立一個資料庫:總結並分類標記出"溢於言表"和"言不由衷"的全部問答情形(當然這有些難做),剩下的機器人通過搜索資料庫,模擬相似度就可以做出簡易判斷了。也許不完美但估計還是能比不少男孩子猜得准一些吧。


目前有很多paper對社交短文本,評論語料的情感傾向做分析。。但是他們所用的語料都是標註的有明顯情感特徵詞的,針對於語料中正話反說,諷刺性的話語,人類不結合語境也無法準確的判斷,所以讓機器準確的分析人類的情感還有好多路要走。


我覺得可以做到這一步,可惜還離我們很遠(兩百年後應該可以了)。首先分析一段對話並不是很難,大多場合普通思維能應付,前提是該人工智慧程序具備學習能力,但對於一個程序來說,人們最害怕的就是它們擁有感情(悲傷、喜悅、興奮、不安等),所以它們肯定會有個限制,肯定還是會有人工智慧處理不了的,其實我覺得主要還是你認為它是什麼,你把它當做什麼影響了溝通(如果你把它代入工具之外的一些角色,分析錯誤也是遲早的事),我覺得等它們突破了所有限制,肯定可以比人類做得更好,但人類應該不敢嘗試的,我覺得這極度危險,引用《神盾局》里克里夫博士的台詞:就像一個嬰兒拿著手榴彈。其實我覺得研發智能生命體(強化人類,生物武器balabala)都比這個安全。不成參考的參考:電影《復仇者聯盟:奧創》、遊戲《使命召喚12:黑色行動3》、美劇《神盾局特工》第四季下半季。


識別文字感情更好的標準是什麼?而且這個問題很沒有經過思考就提問的吧!首先人與人之間很多時候都能夠達到不用說話就知道對方想說什麼的境界,你自己可能也說過或者聽別人說過「不用說了!我都懂!」 這已經屬於一句話的最高境界了!機器想要達到這一境界還要邁過兩個階段才能達到,第一個成為機器人,第二個脫離人的掌控成為不受控制的機器人!也就是有自主感情的機器人,但是請注意,這個時候它從感情上來講已經屬於人類了!那麼你這個問題就爆炸了!人類如何超越自己嗎?


單從文字判斷情緒,我們也時常會判斷錯誤,所以我們為了更好的讓別人了解在聊天時的情緒,通常會加一些表情或表情包。但如果是想要機器判斷表情或表情包是相對容易的,但如果是純文字,就需要通過個人的性格、生活方式或是習慣、地方方言和之前的聊天記錄承上啟下的判斷現在的情緒。這其實是需要大數據的,如果我們提供更多的聊天記錄給機器人,並批註這句話在這個聊天記錄中是什麼樣的情緒,數據越多,機器人判斷的成功率也就越大。

純屬個人見解,歡迎參與套路,大神指導


為什麼要分析情緒?難道老闆不是希望每個人都為公司好?如果智能,直接判斷有利的一面不就可以了?

無論是發脾氣還是調侃,一定有利益的一面(發泄,訴訟,無助等)。

如果為了情緒而情緒,是沒有任何意義的,沒有人是無緣無故的情緒。


Andrew Ng 教授曾回答過計算機人工智慧可以幹什麼和做不到什麼。機器學習能幹的事,很大程度上也是人能幹的事,所以只要有人能做到,離計算機能做到應該也不遠了。


我認為不能,人的感情是體現在文字,語氣,甚至標點上的,機器不能完全理解人的感情,想法,所以聊天時會比較生硬


目前的科學技術水平應該是達不到那種程度,但我們不否認這一可能性。具體說起來,既然人類能夠自己做得到,進化到了這一天,那麼機器人為什麼沒有這種可能呢?


我認為機器可以做得比人好,因為從聊天文字判斷沒有語氣。


別說機器人了,來個超級老司機給我分析一下:來,我下面給你吃的幾種用法和基本分類~


推薦閱讀:

TAG:人工智慧 | 情感 | 自然語言處理 | 聊天機器人 | chatbot |