今日頭條系統推薦的原理是什麼?


簡單來說可分為兩點,一是內容標籤與用戶標籤的匹配,二是用戶對內容的反饋。

內容標籤與用戶標籤的匹配

平台首先會對一個新內容(視頻、圖文、圖集)進行查重,通過之後會從中提取出相關的標籤,然後把這個內容推送給對應標籤的的用戶,用戶的標籤是根據平時的瀏覽習慣、搜索習慣決定的。

用戶對內容的反饋

當這個內容觸達到用戶時便開始了系統推薦的第二步,系統根據用戶對內容的點擊率,互動率,閱讀進度,播放時長等數據進行判斷,數據表現好會擴大推薦量,反之。


開通頭條的以來,本來沒有刻意去研究推薦機制,只是想寫寫自己對運營的一些看法和理解。今天看到這個問題,就花了一些時間去研究了一下,畫了下圖。

頭條的推薦原理是給用戶貼標籤,比如你經常看運營,頭條,自媒體,市場,營銷相關的內容,也許就會能看到我的文章。

頭條的推薦機制是什麼呢?簡單說2種:

1-爆文,推薦100-1000-10000-100000,4次推薦的數量,這個是基於你原有粉絲的反應和第一批用戶的反應。比如說你有100粉絲,全部都轉發,搜藏,點贊了,那麼第二批的量就會很大,仍然有很大互動,第三批,第四批就可能成了爆文。

2-一般文,推薦100-150-200-300,4次推薦。第一批給你的粉絲,發現沒人看。系統不會停止推薦,而是繼續推薦,但是量會增加很少,甚至會減少,正常3批試過以後定位你的文章不受歡迎,基本就定位不會推薦多少量給你了。

有一些投機的小夥伴千萬別想外招,跳出率,終端等也會有衡量,系統可以自動刪除,甚至降低指數,所以還是老實想想做有價值的內容才是王道!


今日頭條推薦機制舉例分析:

1、一篇內容推薦到5萬的流量

2、5萬中有1千人打開

3、1千人身上都打了標籤 ,其中200人打了貓的標籤,190人打了狗的標籤,50人打了花的標籤。

4、去找5萬人打了貓的標籤去推薦,效果有沒有到內部的一個「數值」,其中效果包括點擊率、播完率、評論率、分享率、點贊率

4.1到了這個數值就認為這個貼子有了貓的屬性了,進一步的放量給打了貓標籤的用戶看,

4.2沒到這個數值就去找打了狗的標籤的人去推薦,看是否能到這個數值

5、反覆測試屬性


機器通過計算得出的用戶閱讀興趣

用戶閱讀過的文章分類和關鍵詞;用戶聚類-相似類型用戶還喜歡閱讀的其他文章類型;用戶在今日頭條客戶端主動標記「不感興趣」的實體詞或文章類型。

根據以上數據,系統對用戶的閱讀興趣就能有個基本的判斷。一般來講,用戶使用產品時間越長,系統積累的閱讀數據越多,對其興趣的判斷也就越準確。使用產品的用戶越多,系統對用戶聚類的判斷也越準確。

文章的首次推薦,如果點擊率低,系統認為文章不適合推薦給更多的用戶,會減少二次推薦的推薦量;如果點擊率高,系統則認為文章受用戶喜歡,將進一步增加推薦量。以此類推,文章新一次的推薦量都以上一次推薦的點擊率為依據。此外,文章過了時效期後,推薦量將明顯衰減,時效期節點通常為24小時、72小時和一周。


恕本人直言,演算法可以找出點擊量最高的文章,可點擊量最高的卻一定是下里巴人的文章,而真正高質量的陽春白雪類的文章肯定得不到高的點擊量,那麼,演算法如何在下里巴人和陽春白雪之間取得折中或平衡?機器做得到嗎?


首先看你發的文章的垂直度和點擊回復率,垂直度越高,以及回復喜歡的人越多,今日頭條系統的推舉量就越大,隨之點擊率也會跟著增長了!


一句話,你的文章被推薦後,有一個人看,點贊說好,轉發,評論點贊轉發的多,系統就繼續向其實它用戶推薦,看的人少,沒人點贊轉發,系統就認為文章不好,不會再向其實用戶推薦,文章顯示推薦我認為就是這樣。


推薦閱讀:

買下個月的iPhone新機要花多少錢
醫療界人工智慧,科技巨頭和初創公司的新戰場
求比較帖:聯想小新潮7000-14與聯想air15?
為什麼新浪熱搜總被撤?
2018, 自動駕駛異常艱難的一年

TAG:發財中國年2018 | 演算法 | 移動互聯網 | 科技 | 傳媒 |