文本數據的情感分析
02-02
最近做了幾個小實驗。如何分析文本數據及分析圖像數據,很有意思。
下面這個圖是我用R做的情感分析,數據來源是《權利的遊戲》610的劇本,就是炸的灰飛煙滅那一集,情緒很強烈,波動很大。
library(tidytext),做分析用;library(ggplot2),做圖用。
做完之後覺得不過癮,再找一個劇本試一試。下面這個圖是我非常喜歡的電影《當幸福來敲門》劇本的情感分析。這是我比較愛喝的心靈雞湯,積極正面的情感壓倒性勝利。
然而還是不過癮,我又把計算出來讓人感受最積極的辭彙和最消極的辭彙找出來了。
money,job,love,pay,happy,果然。
更妙的是,如果橫著念這兩組詞,竟然還會有悲慘buff加成的效果。
money leave,job wait, love excuse, pay calls, happy hell, baby asshole......
消極:
Interesting~機器並不能真正理解人類的情感,它所做的只是follow演算法老老實實地接受訓練並給出結果,站在聰明的機器背後的,是更聰明的人。調用API很容易,理解背後的原理並改進模型才是比較難也更有意義的地方,希望未來幾周我能用豐富數據類型training它並繼續作出改進。
接下來應該會忙起來,用一幅劇照來激勵一下自己吧,也希望大家喜歡。
推薦閱讀:
※Kaggle 入門:探索泰坦尼克號事故倖存情況分析
※運營一個 App 需要運用哪些數據?
※學習危機:9張圖幫你讀懂《2018年世界發展報告》