文本數據的情感分析

最近做了幾個小實驗。如何分析文本數據及分析圖像數據,很有意思。

下面這個圖是我用R做的情感分析,數據來源是《權利的遊戲》610的劇本,就是炸的灰飛煙滅那一集,情緒很強烈,波動很大。

library(tidytext),做分析用;library(ggplot2),做圖用。

做完之後覺得不過癮,再找一個劇本試一試。下面這個圖是我非常喜歡的電影《當幸福來敲門》劇本的情感分析。這是我比較愛喝的心靈雞湯,積極正面的情感壓倒性勝利。

然而還是不過癮,我又把計算出來讓人感受最積極的辭彙和最消極的辭彙找出來了。

money,job,love,pay,happy,果然。

更妙的是,如果橫著念這兩組詞,竟然還會有悲慘buff加成的效果。

money leave,job wait, love excuse, pay calls, happy hell, baby asshole......

消極:

Interesting~機器並不能真正理解人類的情感,它所做的只是follow演算法老老實實地接受訓練並給出結果,站在聰明的機器背後的,是更聰明的人。調用API很容易,理解背後的原理並改進模型才是比較難也更有意義的地方,希望未來幾周我能用豐富數據類型training它並繼續作出改進。

接下來應該會忙起來,用一幅劇照來激勵一下自己吧,也希望大家喜歡。

推薦閱讀:

Kaggle 入門:探索泰坦尼克號事故倖存情況分析
運營一個 App 需要運用哪些數據?
學習危機:9張圖幫你讀懂《2018年世界發展報告》

TAG:数据分析 | 文本情感分析 |