標籤:

如何看待這個數據貼?從中你對飯圈獲得了什麼新的認知?

論本土48G的粉絲特徵 數量、結構與流動性(by 高階無窮小)

簡直是論文,一愣一愣的


無窮小被永封了,zhanzhihen這個是我的貼吧id,受他委託幫他發的,幸好最後沒被永封。

這玩意大概年初的時候他就開始做了,爬了2000w左右的數據,在sql server上跑的,中間崩了好幾次,反正蠻蛋疼的,所幸最後還是跑出來了。

數據真實性已經是沒啥問題的,不過實際上某些結論其實蠻有意思的。

比如為什麼會覺得婷鞠是第一cp,很簡單的原因,推小鞠的人一般不反感阿黃,所以有不少加推的,這樣就很不意外的得出婷鞠gay是大勢的情況。當然如果你要得到更準確的理由,就應該去爬取超話的數據,甚至爬取每個粉絲的微博,做情感分析和文本分析的工作了,但是工作量實在太大。

數據角度來說,基本可以看出,恩隊起飛是小鞠四千年的流量,國美依然是至今為止你河除了四千年外最大的吸粉渠道。

知名cp基本全面flop,某個角度來看,你河也是越來越不如從前了。分團吹的左佳,蛋殼,從數據角度來看,依然是非常弱小。

死忠粉+崇拜粉,如果能超過120,十拿九穩進圈,甚至能進32。數量超50,有豪配合就能沖沖圈內。再不好好想想怎麼吸粉和固粉,你河粉絲怕是真的越來越不夠用了。

至於技術問題,其實就是簡單分析,演算法上也沒有特別多的複雜度,甚至從大家角度來看,只是個粗糙的分析而已。不過裡面還是有很多信息可以挖的,我們其實還想勸他挖挖具體細節,做做推薦方面的工作,看看能不能投篇kdd或者sigir的short paper來著,不過具體也看他後續的想法吧,他累死累活佔用了十個月的業餘時間,也該好好給自己放放假了。

最後,擼推永不狗帶。


很多人都說cp粉統計那個問題很大。我覺得這部分並不是傳統意義上的cp粉,其實這個分析完全依靠微博轉贊評,他說的cp粉其實更像是對某幾個成員有好感起碼沒惡意的粉絲,就像我只吃一個cp但是我還是會給卡、黃、朵、鞠等轉贊評,也樂於看到她們互動,數據上可能就像是我站卡朵、婷鞠。我認為這個cp粉婷鞠能站大頭是因為這兩家沒有直接利益衝突,粉絲相互之間容忍度更好,僅是一份隊友情的佔了多數。


第一個感覺是,有這樣的粉絲真的很難得,隨著曾艷芬的事實退團,他也要退坑,真是可惜。

我認為這個數據已經一定程度上脫水了,(微博重複id刷轉評應該剃掉了吧?),這種做下來,即使結論有偏差,數據也是極具說服力的。

另外有些結論我也不很認同,像cp這些,數據雖真,但得不出這樣的結論。

最後這些數據廣度很好,深度還可以挖,可以做到更好,然而回到第一條,聚聚要退了,可惜。

-------

再說點其他的吧。

現在真的沒意思,粉絲完全用屁股講話,對我家不利的數據,極速出來反駁,而且由於知識不足,常常理由蹩腳;對我家有利的數據,極速出來吹捧,有時也吹不到點上。

飯圈之爭畢竟不是爭宗教道統,國家利益,階級地位,沒必要全憑屁股講話。

還有,這個數據做得這麼好,絲芭大概率要來偷走了。


注意到了這個數據。全團的流量入口是鞠婧禕,而S隊的流量入口是莫寒,她貢獻的流量僅次於御三家和林思意。

莫寒沒有大量影視資源,更沒有強推小隊的加成,依靠的是抓住每一次機會,比如因為快本上的出色表現上了熱搜13。

不僅是對所謂「不是出村顏」的諷刺,更是對不肯承認她隊內ace地位的「S喵」的諷刺,「S隊無ace」,直接淡化了她在隊伍組織和流量入口的貢獻。

最主要的諷刺的是運營,今年以來SNH48越來越糊,和對有能力成員的不公平待遇,很有因果關係。


我手已經洗好了,可以摸摸作者的獎盃嗎?

服氣服氣,最近開始自學Python,期待能看到公布代碼,我也想學習一波。

之前不是有個985大一學生沉迷SNH,說想做個優秀的工程師嗎,現在你可以向這位大神取取經了。


這位聚聚辛苦了 一些數據和平時自己分析的差不多 已經很久很久很久沒有看到有乾貨的帖子 15年底16年初飯圈擴大後 不論hhy還是知乎討論內容越來越沒營養

然後 果然從以前到現在 jjy是這團第一流量入口 另一個入口是16年的國美 cp方面大家到不必過於執著 當作友情CP看是不是好理解多了

這是一份有分量的數據 總體看也比較可靠 一堆人非要糾著這個「cp」質疑實在沒意思 其實就是個倆倆組合好感度 給們也別激動了 這麼說吧 一姐家基數大 三姐家人也不少 過去沒有大衝突 好感是有的 直到最近才有個什麼遛粉事件 卡朵擼黃的組合好感人數和她倆比不過的


雖然無窮小今年已經很少發數據貼了,但還是熟悉的味道

大方向基本可以作為結論,小方向可以作為參考


你河粉絲里,會做數據觀察的不少,但是真正會做數據分析的不多。

只能說這篇東西做出來,真的是辛苦了,但是從我的角度講,槽點還真是不是一般的多。

首先,我一直覺得對待大top,不同定位的中堅,以及邊緣成員,新人成員的數據需要完全不同的分析策略和態度,不能一鍋粥一樣一起分析,因為這些不同種類的成員的飯圈發展軌跡,以及所處的發展時期肯定是不一樣的。更不要提大環境和隊伍小環境都會產生不可忽視的影響。如果總結規律的方式有問題,那顯然總結不出正確的規律。

另外還有就是比較敏感的「粉絲流向」問題以及cp飯問題。最大cp群體是婷鞠gay那裡真是把我看笑了~老實說按作者的思路這個結果其實不令我意外,但是顯然這和絕大多數人的感覺與認知差太多了,自然也並非是事實。事實上,究竟為何用文中的演算法會得到這樣的結果,本身就是一個很有趣的論題呢~

你河粉絲圈一直以來沒有發展的很大很複雜過,但是想要做出合理詳盡的分析真的太難太難了。最起碼的,僅靠微博數據,你用再科學再複雜的演算法,分析出朵花來,因為你的初始數據代表性不足,有信息缺失,就已經決定了結果一定是有問題的。

當然了,我對這篇文章有不認同的地方,但其行文邏輯和態度,至少在我看來,值得肯定,即:用數據說話,那便只用數據說話。


先跟這些位聚聚說聲辛苦了,真的很厲害。

打入坑後都很少再見到這麼優質的乾貨了,最近趕了不少學業方面的報告深知做數據分析有多難,可以提煉總結的點實在是太多了,還在認真閱讀中。

個人角度來說,就是看著又欣慰又感傷,不過路還長不是嗎,,?^?,,


很有意思的數據分析

辛苦聚聚了

不知道聚聚願不願意再分享一下爬蟲出來的資料庫,看到的時候已經取消分享了。


數據和邏輯都值得肯定。

但懂數據不代表懂分析;由於數據量的龐大,我們可以人為地引導結果。

當然也可能是你河體量不大卻情況複雜,參雜了太多非數據能解釋的東西(比如cp飯)。

至於新的認知,我很震驚,你河還沒有我想像中糊。


這個聚聚算出來的我推死忠粉絲&崇拜粉絲數量和我瞎猜的差不多……

但是沒想到路人粉會有60多萬。

但是想想60萬人放到13億人里實在是太少了,完全完全不夠。

路漫漫其修遠兮,請我推繼續努力。

最後感嘆一句,擼推就是擼推啊。

技術宅人設永不崩塌。


很棒,但我覺得還是數據分析方面比較強,不過我認真看了看,跟我學的計量經濟學還是關係不大……


emmmm

這個工作量很大,首先向這位聚聚道一聲辛苦。

其次,以這個數據來看,你河目前真的還是小河,任重而道遠。

以這個數據來說,出村的必要遠大於擴村。


圍觀路人一個,以後在這裡每次都先貼這6個字吧,呵呵

對於數據分析,不同維度、指標和定義,在具體案例上的結果差別,可以很大。但是,同一個維度和定義,在不同時間的前後變化趨勢,總是有參考意義的。

舉個例子,某個TOP的粉絲以25歲以上有工作的為主,某個成員以19歲左右剛上大學的為主,其行為特徵差別就很大。如果以更能體現後者的指標來取數據,那麼後者的結果更優秀。因此,有一些結果有爭議很正常。

但是,如果看指標的變化趨勢,那參考意義就高很多了。

比如,該貼裡面,兩次大幅增加的數目,是4000年和16年後(國美?卡黃?)。17年總選後增粉幅度以及固粉力度,相比往年都出現了頹勢。這兩個事情是這個指標反映出來最重要的情況。

尤其是後者,這是絲芭公司改變方針,洗去日本烙印,探索自己道路的結果。眾所周知,絲芭建立公司本質是資本市場的玩法,所以總選後出現頹勢,對其估值和步驟打擊是不小的。個人認為,相比去年拚命與48G劃分界線的一邊倒的策略,絲芭公司今年總選後,對穩固基本盤和洗掉烙印,採取了相對平衡一些的態度,這是重要的原因。

至於這是調整導致的陣痛,還是方向選錯了(作者就提到了應該擴村),是很值得繼續觀察的事情。由於程序已經編完,建議作者可以不定期跟蹤。


這次不是我早說過。

是我早算過了。

不過精算的那個回答好像被友善了。

那就看看粗算的好了。

如果snh48真的有創新和絲芭他們吹的一半。。。

不對,10分之一,那snh48早就紅了。

早就是中國第一女團了。

不開玩笑。


可以可以,贊一個

之後寫各種分析就可以用這個作參考,雖然不一定百分之百準確,但至少比道聽途說的要準確的多。 比如我就看出了4X年雖然low,但是從效果來說是無比成功的,君不見小鞠,433和飛行員對同隊都是吊打嘛。


大牙都給我笑掉了 知道什麼是CP嗎?還婷鞠。前面有人回答說依靠飯圈好感度,照你這麼說憑什麼擼黃不是第一,兩家對彼此的好感度和時間遠大於婷鞠。婷鞠說白了就是一三聯合抗二的總選利益共同體。你看看總選之後兩家是個啥樣?nili酷唯姐姐還搭理黃小推嗎?nili黃小推還繼續跟著走嗎?前一陣兒因為節目撕的逼還記得嗎?這種脆弱的飯圈關係你給我說叫飯圈好感度高???hello??

如果你CP的演算法是飯圈相互好感度

那擼黃和卡朵都遠大於婷鞠。擼黃和卡朵是TOP里少有的從未有過爭端且相互飯圈好感度極高的,並且少有的唯飯對相互也不抗拒。

就這麼說 擼力之前XJQ的事兒 黃家下場的比例算是全團最少的了,並且有的唯飯大聚聚還讓小粉絲不要下場。卡家之前跟XN的事兒,朵家唯飯基本沒下過場,連轉發抽獎都沒跟著摻和。這兩件事兒都基本上是全團轟動,極多人下場,唯飯能忍住不動的這種關係,除了有些許利益共同體的原因,還不能缺少飯圈的相互好感度,只有達到一定程度,夠鐵 才有可能出現。

如果是真正的CP 馬鹿無疑。

而婷鞠 上述兩種都不符合,這個第一CP對整個數據的真實性都有一定程度的影響。

————————————————

就這麼說吧 婷鞠定位相似,路線相似,你給我講飯圈容忍度高?為了個破節目前一次雙方唯飯都暗戳戳diss成什麼樣了?這麼脆弱的飯圈關係你給我說飯圈好感度高???跟黃家那麼鐵的擼家你不談?這飯圈好感度比那個不知道高到哪裡了去了,這麼說吧,就算有一些利益原因,大TOP里擼黃和卡朵的「真心實意」飯圈好感度都足以吊打婷鞠。

知道為啥不?因為她們相互是真的關係好 我說的好不是指普通同事的好,是真正好朋友的好。你敢跟我說婷鞠是好朋友?

————————————————

再一次認真的看了數據,對聚聚的CP數據還是不認同,照您這麼算,小鞠?大top基本排在前列,繼而是發卡+大TOP....這個CP數據不就是著重依靠單人粉絲數嗎....?這也叫CP ????聚聚是辛苦了,感謝。可這一樣讓我不得不懷疑他其他的所有數據。並不是您數據的原因,而是您邏輯的原因,A+B有時候可推不出C來。


數據分析事實證明我X隊還是糊隊ε=(′ο`*)))唉。

數據應該是到10月份為止結束。大致總結一下從數據中看出我X隊伍的形式吧。

首先樓主標註的核心粉絲數量,我 X在三選時期拉了一波高潮,總選結束立馬下降說明總選並沒給X隊帶來流量,應該只是總選期間沉寂粉絲的活躍度提高了。然後進入了很微妙的波浪形上升下降時間至今。

核心粉絲這塊全snh最後。不敢提不敢提。畢竟浪還是x鰻浪。粉絲平均忠誠度前100的成員,我x一個都沒有【真可怕。。不過我覺得這套數據可能有問題,大概成隊時間對這套數據有一定影響,分團粉絲的忠誠度要顯得高很多】,不過詭異的是粉絲重合度,x鰻和其他隊伍的重合度並不算高跟分團差不多。

說道我x最不行的流量,因為是歷史流量累積四大天王並不出意外,但是第五居然是天草,略微有點想不到。丹三老師不虧是我X最厲害的人。

X鰻的生命周期居然是第三超過了先成軍的h隊,說明x鰻浪是浪但是還是很長情的。其中叔叔的粉絲居然是x鰻中最長情的(也是唯一超過平均值的)

以上吧。唯一讓我感覺到不可思議的是現在x隊第一的楊冰怡各項數據倒是一般,不過應該和水水起勢的時間短有關係吧。因為很多數據都是跟歷史數據都有關係。

還有就是丹三還是那個丹三啊。


查了下附件的數據,我的微博也被統計進去。不知道什麼演算法,忠誠度相對突出的有兩位,忠誠度最高的是我的前首推,這點不完全正確。關注她的時間確實最長,出坑時間減入坑時間有300多天,畢竟我是因為她入坑snh,現在是有關注,也有感情,但可能嚴格意義上不算推了。忠誠度其次的那位是我現在的首推,數據低估了,出坑時間減入坑時間才20天,實際上我支持現推已經七個多月,對現推的點贊、評論應該是最多的。還有個我不知道算不算推,但比其他有好感的成員更願意支持的人,雖然出現了名字,但忠誠度數據並不突出。不過我對她一向關注不是太多,多不多是基於推的角度,比大部分成員還是要多。


推薦閱讀:

SNH48重組後,SII出去的潘燕琦貌似撈不了了,溫晶婕和成珏該怎麼撈回來?
snh48擁有這些粉絲和別的偶像明星的粉絲比優勢在哪劣勢又在哪兒?
為什麼聚聚們可以同時推那麼多成員?不累嗎?
莫寒和馮薪朵掉水裡了,陸婷和戴萌誰會先到?
SNH48明年總選大洗牌可能嗎?

TAG:SNH48 |