你家產品在用戶心裡算哪壺?——用語義分析透鏡瞧一瞧

題圖來源:@青藍 2018年2月攝於西雅圖水族館

2017年,某廚房家電品牌客戶需要針對其某一款養生壺產品做用戶評論分析,同時利用其他18款同類競品作參照體系,以挖掘用戶有價值的反饋。而筆者有幸作為數據分析師參與到該項目中,從中學習語義分析與商業分析的應用場景。

準備工作

此次項目目標是幫助客戶企業內部人員基於用戶評論數據量化有價值的信息。那麼,要在哪些維度上量化呢?我們大致可以根據用戶關注度以及競品的差異化組合定義以下四種維度:

  • 用戶關注度低,與競品差異化小
  • 用戶關注度高,與競品差異化小
  • 用戶關注度低,與競品差異化大
  • 用戶關注度高,與競品差異化大

接下來,我們開始定義數據。

  • 數據來源:天貓商城
  • 數據類型:非結構化數據(用戶評論)
  • 時間範圍:2017年
  • 產品數目:19款(從下圖綜合排名較高的產品里挑選)

分門別類

針對 19款產品在天貓商城2017年的用戶評論數據量,我們進行了切詞,詞頻統計,得到的詞雲如下:

基於上圖,我們要怎麼根據這些詞雲去挖掘重要的反饋呢?再分解一下問題,就是我們要怎麼去量化和挖掘對客戶有價值的信息呢?先不急,有一個很重要的環節就是要把這些零散的字詞根據不同屬性進行分類。例如,燕窩、花茶等歸類為食物食材;方便、好用等歸類為使用感受,以此類推。

劃分區域

我們一面數據定義了兩個無量綱指數,一個是體現目標產品與其它競品分別在所對應評論中詞頻率的相對差異,另一個是體現目標產品本身的詞頻率。中間涉及了一些數學計算,就不在此處詳細解析了。最終,把目標產品的詞所對應的分類,映射到二維的坐標圖上。我們以「食物食材」為例,如下圖:

說明:

  1. Y軸(詞頻率):在評論中,針對某詞,出現頻率越高,Y軸的值越大,反之亦然。
  2. X軸(差異化):在X軸上正負之別是如果目標產品針對某詞的出現頻率高於其它18款競品針對某詞的頻率,那麼該詞在X軸的值為正數,反之亦然。

那麼,我們就可以在橫縱坐標軸上大致劃分文章開頭所定義的四個維度了。

用戶關注度低,與競品差異化小【穩紮穩打】:這一塊區域就是不能犯低級錯誤,才能談得上進階另外三個區域。

用戶關注度高,與競品差異化小【時刻警惕】:這一塊區域意味著要緊跟行業的風向和標準,確保不要掉隊。

用戶關注度低,與競品差異化大【揚長避短】:這一塊區域可以挖掘哪些是值得保留的服務及功能。

用戶關注度高,與競品差異化大【招牌特點】:這一塊區域決定了能否跟其他競品一絕高下,建立自身品牌獨有優勢。

提煉信息價值,萃取價值精華

至此,我們已經定義好了數據,也對詞雲進行了分類,並且對這些分類完成了在二維橫縱軸上的映射。接下來,我們可以摩拳擦掌的看看如何針對這些分類進行信息提煉了。我們以上圖最右上角的「產品功效」和「活動」分別打個樣,採用NLP(自然語言處理)對以上的分類所對應的原始評論進行評論情感分析,並以此進行進一步的挖掘。

在產品功效中,用戶討論最多的是「味道」。這個關鍵詞所對應評論中,正面情感的評論比例較高,佔比達到88%。

挖掘出大部分正面評價的用戶是通過目標養生壺所製作出的食品味道感到滿意,以下為部分原始評論截圖。

看起來用目標養生壺烹飪銀耳湯,乾貝海鮮粥,銀耳羹,燉子排這些食材的使用感受不錯,如果還有更多相同共性發現的話,可以考慮在養生壺和禮品的結合中著重留意這幾款食材。

而負面情感比例達到了10%以上,基本上負面評論的用戶是對目標養生壺產品本身的味道有所非議,雖然這類問題看似被反饋的數量不多,但從時間的分布來看,這些問題並不是偶爾出現,這足以向負責產品體驗的同學敲黑板了,以下為部分原始評論截圖。

從以上評論中,我們也可以發現,一旦用戶認為花的價錢貴了,那麼對產品容錯率也就非常低了,縱使其它功能萬般好,但只要有瑕疵,那麼都會跟價格作為綁定去吐槽。看來價格的制定是需要結合用戶對產品的錯誤容忍底線。

我們再看看「活動 」分類,用戶關注最多的是「送的 」關鍵詞。該關鍵字所對應的評論的正面情感評論比例接近88%。

通過挖掘我們發現用戶的大體反饋是目標養生壺精美,附贈的禮品多而靚麗,畢竟始於顏值而不終於顏值是能打動消費者好評的關鍵因素之一,以下為部分原始評論截圖。

筆者感覺,打動消費者不僅僅要自身的底子夠硬,包裝精美和實惠也是能獲取外貌協會的用戶青睞,畢竟在這個看顏值的時代,實力夠硬是入門門檻啊。

而負面情感的評論比例,雖然只佔到7.3%,但從用戶的負面評論里我們可以看到主要是針對送的食材料包質量及體驗不滿意。同理,如果這類問題出現次數過於頻繁,最好防範於未然,否則會被衍生產品影響到了主體產品,得不償失。以下為部分原始評論截圖。

在評論中,居然還有用戶出現腹瀉不止的現象。建議負責食材的產品同學,在食材的烹煮上詳細的給出注意事項,以及食材不適宜人群也要羅列出來。畢竟吃得健康,是很重要的民生問題。

其它分類,在這裡我們就不一一分析了。通過以上的介紹,我們可以發現,根據分類的坐標定位,結合語義分析的情感劃分,我們可以快速定位用戶對於產品不同屬性的針對性反饋,以此來提煉有共性和有價值的信息。

結語

筆者認為以往一招鮮吃遍天的打法已經逐漸被淘汰,各品牌廠商已經切換到更高維的模式去細分消費者不同的體驗場景,用以來打磨產品及服務的爆點。隨著消費者的認知升級,商家需要更多的去跟蹤消費者對於自身產品及服務的全方位反饋。這樣不僅在建立消費者對自身品牌的客觀認知之餘,也能在眾多的價格戰戰役中建立穩固的堡壘。

在這種努力中,一面數據可以幫助商家可以把跨競品用戶評論收集起來,通過自然語言解析、聚類分析、情感分析、原文抽取,明確自己的招牌特點,找到需要穩紮穩打、時刻警惕、揚長避短的方面,根據客戶反饋快速應對,適應消費升級的新常態。

文:@白羽墨

可視化支持:wentu.io,Tableau Software

更多文章關註:數據冰山-知乎專欄


推薦閱讀:

我為什麼從技術角度不看好中國的智能音箱
NNLM最新論文調研-1-《Character-Aware Neural Language Models》
ICLR2017最新論文調研-1-《Learning to Compose Words into Sentences with Reinforcement Learning》
RNN基本模型匯總(deeplearning.ai)

TAG:自然語言處理 | 消費升級TradingUp | 廚房小家電 |