26萬條抖音數據背後的推薦邏輯以及嚴重失調的男女比例

26萬條抖音數據背後的推薦邏輯以及嚴重失調的男女比例

本文作者:喜哥(張佳)

易靈微課《數據分析-認知與實踐》講師

新榜數據分析師

人人都是產品經理、華爾街見聞專欄作家

簡書科技類優秀作者

本文首發自公眾號喜新(noyanjiu),如需轉載請註明出處


這次是26W條數據,應該可以說明更多問題。

和往常一樣,先給出分析結論,希望你能引起你的興趣:

  1. 首次推薦分水嶺應該在5000人,點贊不過百基本涼了;
  2. 抖音紅利似乎在消失,用戶越來越不喜歡點贊了;
  3. 15s不一定是最好的,可以試試10s;
  4. 男女比例嚴重失調,小哥哥的視頻更受喜愛;
  5. 「生活化」是抖音內容的主體,年輕人樂於表達愛和喜歡;
  6. 90後是抖音的主力軍,94年小哥哥小姐姐最多;
  7. 一些小技巧,比如把抖音視頻分享到微信和朋友圈;
  8. 一個很棒的廣告

下面是正文

數據介紹

數據區間是2018年2月1日—5月10日,歷時兩個月,累計260968條。採集過程中,對作者做了去重處理,也就是說每個作者只取了TA的一條視頻數據。這也代表著我們擁有26W個作者的數據。

數據包含視頻描述、發布時間、播放數、點贊數、評論數、轉發數、尺寸、清晰度、時長、是否包含商品廣告、是否包含水印,以及視頻作者的昵稱、性別、生日、賬號創建時間、是否認證、認證類型等數據。

另外,數據均為前端可見數據,未使用任何違規操作。

首次推薦分水嶺是5000,請把贊「刷」到100+

做過今日頭條自媒體賬號的人應該了解,頭條的推薦演算法是先把文章做小範圍推薦,查看文章在該部分人中的閱讀數據,如果閱讀數據良好,則會擴大文章的推薦範圍。數據越好,推薦範圍則越大。

既然抖音是頭條系產品,那肯定採用了同樣的推薦邏輯。從用戶的方便程度來看,點贊>評論>轉發,那麼點贊作為推薦演算法的指標權重應該會大於其他兩個。從頭條的推薦演算法推測,視頻應該會先被推薦給一部分用戶,如果點贊數達到某個水平,則會將視頻推薦給更多的人;如果沒有,那麼視頻大概率會涼了。

經過不斷分段統計視頻各播放量與點贊之間的關係,得到了下面這張表格:

由於採集機制的原因,我們很難採集到沒有被推薦的視頻,但就現有的1907條播放量在5000以下的視頻我們可以清晰地看到,這些視頻的點贊量100以下的佔到了94%。那麼反過來可以推斷,想要你的視頻被更多的人看到(也就是進入系統推薦的二階段),那麼你視頻的點贊量至少應該增加到100以上。

我做了幾個視頻進行了測試,發布後分享出去讓好友幫忙點贊(下文會給出方法),那些在1小時內點贊量突破一百的,播放量在幾小時內很快破萬;而那些點贊量低的,則不再被人問津。

即便這個結果在測試中得到了驗證,但是我卻不能給出實錘結論。

首先,目前採集到的低於5000播放量的數據,大都在5月以後發布,傳播時間不夠長,或許這恰好是點贊量低的原因;其次,與整體的樣本量相比,這部分數據只佔不到1%,沒有達到統計分析的樣本數要求。

無論如何,視頻的點贊量肯定會作為推薦權重的依據,點贊越高自然是越好的。

看似紅紅火火,但瓶頸似乎已經到來

作者數據包含了賬號的註冊時間,我把作者的註冊時間按照月份統計,發現抖音用戶的增長似乎在放緩:

從上面的用戶註冊時間分布來看,抖音用戶在2018年1月份達到頂峰,隨後開始逐月遞減,4月份已經只有3月份的一半!

實際上,這個數據仍然存在一些漏洞。畢竟存在一種可能,就是新註冊的用戶不喜歡發布視頻,而是在註冊一段時間後才開始發布。或者,新註冊用戶的視頻因為還未得到系統的推薦,被我們採集到的概率也隨之降低。

如果賬號的創建時間不能說明問題,我們來看另一組數據。

把視頻的發布時間與其相對應的播放量和點贊量結合,我得到了各月發布視頻的平均點贊量。為了去除數據傳播時長的影響,我去掉了5月以後發布的視頻,得到各月平均點贊量分布圖:

數據顯示,各月視頻的平均點贊數在逐月降低,4月份食品平均點贊量甚至不足3月份的一半。或許是因為視頻越來越堵,用戶已經麻木,但無論如何,早期的紅利在逐漸降低,想上車的要趕緊了。

拍滿15s不是最好的,10s更受用戶歡迎

目前抖音未公布獲得視頻超過15s時長許可權的機制,但至少我們知道「優質」是選拔的重要條件,所以在分析視頻時長時,我去掉了時長超過15s的視頻。對15s以內視頻的平均點贊情況作了分析,得到以下分布圖:

數據並不支持我們把視頻拍滿15s,10s是最好的,13s也不錯,甚至11s都優於15s。

由於超過15s的視頻數量僅6866條,在樣本中佔比太少,我就不再給出分析。在相同數量級下(均少於100條),39s、42s、50s和58s看上去效果不錯。

男女比例嚴重失調,小哥哥的視頻更受歡迎

統計26W個作者的性別,我發現抖音用戶中女性用戶數量接近男性的3倍!顯然是嚴重失調。

(註:「無」代表用戶沒有填寫性別信息)

從用戶組成來看,就很容易理解為什麼抖音的帶貨能力這麼強了。從購物能力來看,女性購買力更強,畢竟大部分錢都掌握在女性的手裡。

把作者性別和其發布視頻的平均點贊量結合,我神奇的發現,小哥哥們的視頻竟然更受歡迎!

難不成是因為女性用戶多於男性,異性相吸?

註:沒有性別信息的用戶有多個視頻點贊量超過百萬(比如用戶@安德羅妮、的一個視頻點贊量達到600W),造成了該類別用戶的平均點贊量過高,不排除這部分用戶均為女性的可能性。

生活化的內容是抖音的主流,年輕人願意表達愛與喜歡

使用新浪微輿情(wyq.sina.com)的文本分析功能,把視頻的描述文字做了詞性和情感方面的分析,發現生活化的內容是抖音的主體。

對視頻描述文本的詞性分析,動詞方面除了「喜歡」和「愛」以外,生活化的「想」、「拍」、「吃」是出現頻率最高的詞;形容詞方面「快樂」、「開心」、「好看」和「可愛」是抖音用戶最喜歡錶達的感情;名詞上「小哥哥」和「小姐姐」顯然已經成為發抖音的固定搭配。

整體詞頻方面,除了「小哥哥」、「小姐姐」以及「抖音小助手」以外,具備強烈生活色彩的「爸爸」、「我媽」、「弟弟」、「老公」、「我家」這些詞同樣被高頻率使用。

抖音是90後的天下,94年是主力軍

對作者的出生年齡進行統計,排除掉建國以前出生和至今未出生的用戶,得到如下年齡人數分布圖像:

(點擊圖片放大查看)

圖像已經很清楚的告訴我們,抖音的已經是90後的天下,94年是這其中的核心。不過算算也對,94年出生的人現在已經24歲了(我還以為14),正是最青春、最喜歡新鮮事物的年華。

所以,主打年輕人的品牌可以入駐或者把廣告投放搞起來了。

福利:一些抖音小技巧

1.把視頻分享到微信,不被屏蔽甚至可以直接跳轉到抖音

由於「互聯網短視頻整治期間,平台將統一暫停直接播放」,我們分享到抖音的視頻會變成一長串鏈接,這大大降低了我們視頻的曝光度。但這些阻擋不了聰明的互聯網人(也就是我了)致力於傳播的熱情,我使用一些黑科技手段為大家開發了一個小工具,可以幫助你們把抖音視頻分享到微信,點擊後直接跳轉到抖音APP播放,像下圖這樣:

生成鏈接打開後的應用寶頁面也是可以分享出去的,點擊後同樣可以直達你的抖音視頻。具體製作方法我就不透露了……(可以加作者公眾號閱讀原文獲取

2.精細化運營,一些小細節很重要

我們來看下面兩個視頻截圖,你發現什麼差別了么?

如果兩個視頻都需要視頻描述來完善視頻的內容,那麼後一個視頻的效果會更好,因為相比於白色視頻背景,純黑色可以非常清晰的把底部的視頻描述凸顯出來。

除此以外,視頻內容和質量相似的情況下,豎向的視頻比橫向的視頻更容易被點贊,不信你橫過手機點贊一下試試……

3.能不能繞過機器篩選直接被推薦到更大的流量池?

隨著監管制度的完善,純機器演算法篩選和推薦已經不能滿足用戶對高質量內容的需求,於是今日頭條引入了大量人工審核團隊。這些人工除了審核內容是否違規外,還承擔發現優質內容、使其提前進入推薦隊列的職責(我猜的)。如果我猜對了,那麼,如果視頻能跨過機器的迭代推薦,直達人工,豈不是會更快速的火起來?

我有一個冒風險的辦法,並且測試成功了一次(只測試了一次,200粉絲半小時飆升到1W2播放量),你們如果膽大也可以試一試:在視頻描述里加入一些機器識別不準確的敏感詞,像這樣:


易靈微課運營小姐姐說:

如果你對數據分析感興趣,歡迎到張佳老師在易靈微課開的新課《數據分析-實戰與認知》來共同探討數據分析。

關於課程難度:

張佳老師表示課程不會太深,盡量做到人人都能聽懂,所以如果你已經是數據分析大神,就可能不太能滿足你的需求啦!

適合誰來聽:

品牌PR

新媒體運營

對數據方向產品感興趣的人

任何想要通過數據優化工作、生活的你

感謝你的贊、感謝、分享!


微信公眾號:易靈微課(yike-fm)

有限的時間,只為「價值」買單,歡迎關注,讓我們一起進步

推薦閱讀:

有禮有面有據 - 當紀錄片遇到數據可視化
營銷已死,增長為王(下)|一森管理案例之數據時代
恭喜你!成功由遊樂場模式升級為荒野求生模式
如何快速了解一個行業(長文預警~)
數據分析驅動業績增長

TAG:數據分析 | 互聯網數據分析 | 抖音運營 |