大數據揭示你心中的冪冪,為何愛她不敢說出口
前不久,看到知乎上一個知友提到了一個問題,覺得有點意思,於是心血來潮寫了一個回答,現在粘貼複製到這裡:
不扯犢子,就直接以題主的舉例來上乾貨,分析的對象是目前大紅大紫的《三生三世十里桃花》(以下簡稱「三生三世「),從輿情角度來分析該劇在全網的熱度和關注度情況。
我的分析主要分為兩大模塊,一個是粗線條的、全局性的全網輿情分析,用的是新浪微輿情的熱度指數查詢功能;另一個是較細緻的、微觀的單條微博傳播分析,用的是新浪微輿情的微博傳播分析功能,話不多說,直接上分析~
一、全網熱度分析
這一部分的分析,主要分為如下幾個部分,直接上圖:
1 「三生三世」的全網熱度概況
熱度指數是反映事件關注度的一個重要數據指標,它的全稱是「網路傳播熱度指數」,是指在從新聞媒體、微博、微信、客戶端、網站、論壇等互聯網平台採集海量信息的基礎上,提取與指定事件、人物、品牌、地域等相關的信息,並對所提取的信息進行標準化計算後得出的指數。
熱度指數能客觀反映事件、人物、品牌、地域等在互聯網上的受關注程度。熱度指數所呈現的數值為0~100,數值越大,表明其網路受關注度越高。
從上面的熱度指數來看,雖然《三生三世十里桃花》的網路熱度值較上一個24小時降低了3個百分點,指數有近1.74個點的下滑,但它的熱度值仍保持在一個較高的水平,即保持在50%的水平之上,且起伏不大,這種熱度指數中算一個較高的水平了,而且它的全網信息量達到了驚人的一百多萬條,該劇之火熱可見一斑!
2 「三生三世」的全網熱度走勢
從指數變化趨勢來看,再結合上面的指數概況,《三生三世十里桃花》的熱度在02月22日 09時達到了88.86的峰值。
這時,大家可能會好奇了:是什麼造成了「三生三世」的熱度峰值呢,本著「知其然也要知其所以然」的宗旨,讓我們再來看看達到熱度指數峰值處的重點信息聚類,即達到熱度指數峰值處的主要輿論有哪些。看下圖:
看了下,這些傳播的主體主要是一些娛樂媒體,如優酷、故心電影、文娛教主等知名娛樂媒體,當然也包括楊冪本人的微博。等等,人民網也參與報道了,這種正兒八經的媒體也開始八卦了,可見「三生三世」的影響力!
3 「三生三世」的全網關鍵詞雲
以下是全網關於《三生三世十里桃花》的文本信息的關鍵詞提取,總計有60個,這些關鍵詞來自於媒體報道,抑或用戶UGC評論,從中我們可以發現網路上關於該劇的討論集中在哪些關鍵點上。
可以看出,男女豬腳當然是大家八卦討論的熱門,楊冪和趙又廷是大家關注的熱點人物。而其中的一些配角及精彩劇情片段,如迪麗熱巴、喝悶酒、洗澡、退婚等。
總之,全網關於該劇的討論都濃縮在這裡了,懶得看評論卻又想知道這部熱播劇的你,可以好好琢磨下這些關鍵詞~
4 「三生三世」的全網信息來源類型
「信息來源」部分中,反映出了事件信息的來源佔比情況。
從上圖可以看出,與三生三世十里桃花相關的信息主要來源於微博(99.43%)、論壇(0.25%)和網站(0.12%)。
由此可見,處於上升期的新浪微博仍是全民娛樂的主陣地,是娛樂劇搞營銷的首選~
5 「三生三世」全網信息的地域分布
(事件熱度信息的)地域分布反映的是搜索事件的全網信息量在全國各地的分布情況,這一點與百度指數的原理一樣。
從上面的信息量地域分布可以看出,江西地區的吃瓜群眾對「三生三世」的討論(包括媒體和個人)最多,其次是廣東、江蘇和地處東北的遼寧,看來這些地區的網民大眾對該劇特別推崇(當然也不排除吐槽很多。。。)
6 與「三生三世」相關的關聯詞分析
事件熱度信息的關聯詞分析,它是通過系統自動運算找出事件核心詞、並計算出與核心詞同時出現關聯度最高的高頻詞,也就是與核心詞共現頻率最高的辭彙(關於「共現」的原理介紹,請看《如何用數據分析,搞定新媒體運營的定位和內容初始化?》的第三部分)。
通過對與三生三世十里桃花相關的信息進行分析後可看出,其核心詞「三生三世十里桃花」關聯度最高的詞語為電視劇(52.78%)、楊冪(40.73%)和趙又廷(29.36%)。
果然言情劇集,男女豬腳是大家關注和討論的重點,這也解釋了為什麼很多電影頂住成為爛片的壓力去選擇那些粉絲群體龐大的明星做主角,明知他們的演技堪憂。。。。
好了,這是來自於全網的對於「三生三世」的輿情概況分析,現在,讓我們穿越到「三生三世十里桃花」的新浪微博,來進一步的分析一下某一條高人氣微博的微博傳播情況,以及各種關於粉絲UGC的分析。
二、重點微博傳播分析
對單條微博的傳播分析分為以下幾個板塊:
先找到「三生三世」的電視劇的官方微博,如下圖所示:
找來找去,我挑了一條傳播情況不錯的微博(轉發量、評論量及點贊量三高的微博)作為分析對象:
1 傳播節點分析
從上圖可以看出,「三生三世」的傳播節點分布情況能概括為「一個中心,兩個基本點」---以「三生三世」的微博官微為中心,以楊冪的2個粉絲團官微賬號---「楊冪官方粉絲團」和「楊冪微吧」為基本點,來展開本條微博的營銷宣傳。
首先,「電視劇三生三世十里桃花」本身的粉絲量就很大,看下圖:
所以它本身被自己的粉絲互動節點所包圍,形成了一個近似實心的圓形,而楊冪的粉絲團影響力稍弱了,但是它們的影響力也不容小覷哦,為什麼這麼說呢?請接著往下看~
2 轉發層級分析
剛才的傳播節點是範圍上、廣度上的傳播,而轉發層級則是在信息傳播深度上的體現---具體表現為,傳播的層級越高,覆蓋的人次越多,則該條微博的影響力就越大。
本條微博的傳播層級為7級,有效轉發為9594人次,覆蓋的人次逾527萬,傳播深度的重要影響因素之一,就是上面所提及的關鍵傳播節點,也就是楊冪的粉絲團,從「核心轉發TOP15」中科院看出,楊冪的粉絲團佔了半壁江山,毋容置疑,都是從剛才2個重要的楊冪粉絲官微傳播出去的。
ps:差點忽視了趙又廷粉絲團的貢獻~
3 轉發評論趨勢分析
要知道,事件的傳播也是有生命周期的。能夠十分清晰的觀察到該微博轉發、評論的發展趨勢,微博的互動及散播活躍與否,以及處於生命周期的哪個階段(引發期、醞釀期、發生期、發展期、高潮期、處理期、平息期和反饋期),對於及時、準確研判事件及輿情走向起到至關重要的作用,我們在采編媒體素材時就能知曉該事件是否還有繼續追蹤報道的必要了。
從上圖堪憂看出,轉發評論行為在大體上是呈衰減的趨勢的,24小時後基本偃旗息鼓,意見領袖也集中在微博發出的前幾個小時,可見微博傳播的效率和速度,來也快,去也快,所以得在發出微博的幾個小時內搞好大號轉發事宜。
4 意見領袖的影響力排名
這裡的影響力排名主要是轉發評論排前10的各個微博等級的用戶,他們對該條微博傳播效力的貢獻較大。
跟前一個分析一樣,楊冪粉絲團的鼎力支持太明顯了,瘋狂轉髮帶來的效果也是立竿見影的!
5 互動粉絲畫像分析
這裡的粉絲畫像的分析對象僅是那些參與轉發和評論的用戶的,屬於活躍用戶。
以下是他們的地域分析、性別佔比、興趣標籤和使用設備等畫像信息,能在一定程度上反映出該劇粉絲的一些特徵。
地域分布不多說,於國內互聯網網民的地理分布幾近一致,也是年輕網民的幾個省市。
性別佔比也一樣,該劇還是屬於言情劇,妹子當然是主要的觀劇群體咯。
參與互動的粉絲活躍度可以通過粉絲數量區間分布看出,從中粉絲擁有的粉絲量多寡可以看出該粉絲的微博活躍度。其中,粉絲量10-49這個區間的互動粉絲居多,再次是50-99,100-199這兩個粉絲區間互動用戶。
當然,互動粉絲中,也不乏活躍度較高的群體,比如500-999這個區間的粉絲也有大幾百個。整體來看,「三生三世」的互動粉絲的質量比較高,出現水軍的幾率不大。
上面的互動粉絲標籤中,旅遊、沒事、娛樂、時尚等標籤赫然在目,大家果然都是熱愛生活的人(更確切的說,是熱愛生活的新時代女性~)一樣的情況也出現在下面的互動粉絲使用設備中,iPhone坐第一把交椅不消說,OPPO、華為、小米、vivo等品牌佔比較多,國內主流的智能手機品牌基本都全了。
6 用戶UGC分析
最後一個是關於互動粉絲的UGC內容分析了,分為兩塊,一個是文本信息的分析,從用戶的互動評論中發現他們討論的熱點信息;另一個是發布emoji表情的分析,看他們對於本條微博的情感態度如何。
從上面的用戶評論分析可以看出,互動粉絲對於本條微博的情感持消極/吐槽的比重很小,大家是來捧場的,而不是來砸場子的~
同時,透過評論熱詞可以看到,用戶對於「桃花夫婦」的關照比較多,「楊冪」和「趙又廷、「姑姑」和「姑父」;再者就是對海報的褒讚,」海報「、」好美「、」如畫「、」飄飄「、」眉眼「、」太美「、」美了「以及」(四海)八荒「等。
上面的圖中,喜極而泣的表情最多,無論在轉發還是評論中,隨機找了幾個帶有該表情的評論,如下圖所示:
原來是海報里的「天族舞王」驚艷到了大家!
排行第二的表情就是時下流行的「dog」表情,充滿戲謔和自嘲的趕腳,比如:
寫在最後:
從上面鄙喵的分析中可以看出,通過全網和微博的大數據輿情分析,我們能在較短的時間內對某一網路平台上事件的發展態勢及其各種意見形成一個高度聚合的印象,哪怕你沒看過這部劇,但是通過大數據,你也能基本了解這部劇說的是啥,大家對它的看法是啥...
ps:寫這篇文章的我可是一集「三生三世」也沒看過,全靠數據分析,哈哈哈~
參考資料:
1.新浪微輿情-互聯網大數據平台
2.【數據運營】揭開微博轉發傳播的規律:以「人民日報」發布的G20文藝晚會微博為例
3.當數據分析遭遇心理動力學:用戶深層次的情感需求浮出水面(萬字長文,附實例分析) - PMCAFF產品經理社區
----------------------------------------------------------------
本作者:高長寬
微信公眾號:運營喵是怎樣煉成的
博客專欄:運營喵是怎樣煉成的的博客專欄
最近很多人私信問題,平常知乎評論看到不多,如果沒有及時回復,大家也可以加小編微信:tszhihu,進知乎大數據分析挖掘交流群,可以跟各位老師互相交流。謝謝。
推薦閱讀:
※國內商業銀行信用卡中心對於大數據分析的進展如何?
※第十周筆記:大量數據演算法
※大數據培訓2萬多的課程安排是否合理,大佬們給小白點建議,萬分感謝 ?