今日頭條文章推薦機制大解析!為什麼你的文章推薦量少?
今日頭條,大家公認的一個超級大流量平台,其最大的特點就是文章的智能推薦系統。
n但是,有些人在今日頭條文章動輒幾十萬、幾百萬,甚至上千萬閱讀,但有些則只是幾十、幾百的流量。
n除了內容本身的質量以及賬號區別之外,最大的關鍵就在於其演算法推薦規則。搞懂今日頭條文章推薦規則,是在這裡進行精細化運營的核心關鍵。
n
那麼,今日頭條海量文章推薦的機制是怎麼樣呢?為什麼有的文章展現量幾百萬,有的卻只有幾十幾百?對於文章的推薦機制我們又能做些什麼?
n首先在說文章推薦規則之前,另一個機制大家一定要先了解,那就是今日頭條的消重機制。
n你在頭條號發布的內容,在通過審核和進入推薦系統之間,還有一道難關,那就是下面要說的消重機制。
n基本上,文章被消重是頭條號所發布內容無推薦量的最常見的原因。
n1 想要被推薦,先了解消重機制
n
1)什麼是消重?
n我們都知道,在互聯網上,同樣的文章、圖片、視頻往往會被很多其他媒體轉載或複製。
n如果我們在百度搜索一篇內容,經常會得到多個網址。所以,我們一般需要自己篩選和判斷,哪個網址更權威,更有價值,再點擊去訪問就可以了。
n但是今日頭條不一樣,它是基於演算法推薦給用戶的。所以一定要保證不能連續給用戶推薦了幾篇相似的內容,否者用戶體驗會非常差:怎麼老是給我推薦一樣的內容,什麼鬼系統!
n所以,今日頭條在推薦你的文章之前,必須確定這篇內容:
n
● n在系統里是否存在相同或者高度相似的內容?
n● n如果存在,那麼這篇內容的來源是否是最權威、最有價值、是否最有可能是原創來源?
n那麼,消重就是指對重複、相似、相關的文章進行分類和比對,使其不會同時或重複出現在用戶信息流中的過程。
n今日頭條首先會通過消重機制來決定同樣主題或內容的文章是否有機會被推薦給更多用戶。
n2)頭條號內容消重的關鍵項
n那如何判斷兩個內容是否相同呢?
n如果讓人來判斷,可能就要逐字逐句地把文章讀完才能判斷得出來。通過計算機這樣去判斷當然也是可以的,不過,當每天需要處理的內容達到十多萬篇次的時候,這麼做即使對於計算機來也太麻煩了。
n今日頭條的做法是,通過系統的計算,一篇文章的文本、標題、圖片等都是可以轉換成一串數字代碼,也就是信息指紋。這就像我們每個人的身份證,如果兩個人的身份證號碼一模一樣,那麼就可以肯定這是兩個一樣的人。
n而文字信息的「身份證」也能起到類似的作用,對於圖片、視頻等信息形式,原理也是類似的。這種演算法模型這裡就不多說了,重點來看影響消重的關鍵項。
n
● n來源頭條號是否開通「原創」標記;
n● n發布時間(首發很重要);
n● n來源的權威性和在網路上被引用的次數。
n除了內容消重的規則外,頭條號平台上實際上還存在這一些針對內容之外的消重規則:
n● n標題和預覽圖片的消重。
n這個原理與內容消重相似,只不過是只比較標題以及預覽圖片的「信息指紋」。
n之所以要對具有相同的標題或者預覽圖片的內容進行消重(哪怕它們的內容並不相同),是因為,假如用戶沒有點擊內容詳情頁,他是不知道內容寫的什麼的。
n那麼,光看標題和預覽圖就是系統把兩篇一樣的內容重複推薦給了自己,可想而知這樣的瀏覽體驗是很糟糕的。
n況且,很少有人願意連續點擊幾篇看上去一模一樣的內容,因此這樣的推薦也很少起效果。
n● n針對相似主題的消重。
n你肯定對這樣的景象不陌生:每當有某個社會熱點事件或者話題出現的時候,媒體、自媒體、KOL們一擁而上,競相報道事件細節或者發表觀點,讓你的微博、朋友圈被有關這件事的種種內容「刷屏」。
n但是,對於用戶來說,需要的其實並不是反覆看到相同的信息,如果有足夠優質的報道或者觀點的話,其實看有限的幾條就夠了。
n相似主題的消重其實和內容的消重其實原理是一樣的,是對文章中全部的關鍵詞(也就是我們常說的標籤)進行統計並計算信息指紋,當然也可以對其中與話題相關的關鍵詞進行統計分析。
n一旦系統發現了可能對某篇內容感興趣的用戶,那麼系統會自動把具有同樣「信息指紋」的內容或話題中,經過挑選最優的一篇推薦到用戶的信息流。
n剩下具有相同「信息指紋」的內容,就幾乎不可能獲得推薦了。
n這裡,木木重點說一下相似主題消重,這個與我們是最最最相關的。因為頭條要追熱點,基本是大家公認的事實。
n3)追熱點小心被消重
n在頭條號追熱點話題的時候,一定要謹慎追逐。
n因為有這個相似主題消重,那具有相同「信息指紋」的話題或熱點,幾乎不可能獲得推薦了。這就是為什麼很多時候我們的熱點文章在頭條號會推薦慘淡。
n
一個熱點再熱,用戶的興趣也是有限的,特別是如果你的熱點角度沒什麼區別,平台已經推薦過相似內容了,那系統是不願意再推薦的,因為用戶他已經懂了,再推薦就是打擾了!
n所以說你追熱點的角度一定要差異化,寫熱點文章有很多切入點,你可以把一個熱點進行拆分關鍵詞,每一個都可以是一個很好的切入口,這就是所謂的「同主題異角度」。
n與此同時,你的標題也要明顯的差異化,因為這個熱點標籤的提取統計,主要來自於標題,而後才是內容。並且,在一個大熱點下,用戶想知關於熱點的各個方面,所以標題角度也要明顯。
n如果不能確定自己創作的角度足夠獨特,及自己的內容足夠優質,那麼就不要隨意地追逐熱點,免得做了無用功。
n2 今日頭條文章推薦規則解析
n我們知道,文章的閱讀量很大程度上取決於系統的推薦量,那麼一篇文章的推薦量,是由什麼因素決定的呢?
n之前,頭條官方給過一些標準,即影響文章推薦的 n8 個因素是:
n1)點擊率+讀完率:點擊標題並讀完文章的人越多,推薦越高;
n2)分類明確:文章興趣點越明確,推薦越高;
n3)文題一致:做恰如其分的標題黨;
n4)內容質量:優質內容才是根本;
n5)賬號定位明確:文章題材隨意寬泛的賬號,得到推薦的概率更低;
n6)互動數、訂閱數:讀者越活躍,推薦越多;
n7)站外熱度:在互聯網上關注度高的話題,推薦越多;
n8)發文頻率:經常發文,保持活躍很重要。
n不過這些都是一些表象的東西,這裡更系統和深入的說一下,只有知道本質了我們才能更好的做好這些。
n1)系統是怎樣理解你的文章的?
n今日頭條的文章識別系統會對文章進行特徵識別,從而判斷文章講的是什麼類型和領域的內容。特徵識別的維度有很多,在這裡我們重點解釋「關鍵詞」。
n系統會根據文章中出現的頻率,提取出一些詞語作為關鍵詞,關鍵詞的判定原則有二:
n詞頻高:如一篇體育類文章內容關於某場足球比賽,那麼文章可能會出現的高頻詞就包括球員名字、足球術語或技巧等,如「C n羅」、「射門」、「突破」。
n同類文章中出現次數少:作者撰文時常用到的虛詞、轉折詞等出現頻率也很高,但它們不會作為關鍵詞被提取出來,因為這些詞在文章中是普遍存在的。
n系統判定出一篇文章的關鍵詞後,會將這些關鍵詞與文章分類模型進行比對,命中哪些分類詞庫關鍵詞的比例大,文章即被打上該分類的標籤。
n如,一篇文章排名靠前的關鍵詞為「C n羅」、「射門」、「西甲」、「馬德里」,那麼該篇文章可能會被打上「足球」、「國際足球」、「西班牙」等標籤,完成對文章的初步認知。
n而除文章正文關鍵詞識別外,系統還會對標題進行關鍵詞的識別和分類比對。因此,在標題中露出具代表性的實體詞非常重要。
n2)你的文章會被推薦給哪些用戶?
n每個人的閱讀興趣都是大不相同的,個性化推薦機制要做的事情就是——讓每位用戶看到可能感興趣的內容。
n這種精準推薦,是建立在機器對每位用戶都有充分認知的前提下的。在系統裡面,每位用戶實際是由大量數據構成的,用戶的閱讀興趣就藏在這些數據中:
n● n用戶的基本信息
n性別、年齡、所處地理位置(城市或地區);還有使用機型、授權賬戶(如微博、微信等)、手機上經常使用的其他 nApp 等。
n● n用戶主動訂閱或喜歡的內容
n訂閱帳號;訂閱頻道;關注的話題。
n● n機器通過計算得出的用戶閱讀興趣
n用戶閱讀過的文章分類和關鍵詞;相似類型用戶還喜歡閱讀的其他文章類型;用戶在今日頭條客戶端主動標記「不感興趣」的實體詞或文章類型。
n根據以上數據,系統對用戶的閱讀興趣就能有個基本的判斷。然後通過對數據的處理,每位用戶將被系統打上各種標籤。
n如一個用戶閱讀的文章中關鍵詞排名靠前的是:C羅、皇家馬德里、歐洲杯、小米、魅族、蘋果。
n那麼,這位用戶可能被打上「足球、「皇馬」、「科技」、「手機」、「米粉」等標籤。不同的用戶會被打上不同的標籤。
n最後,當一篇帶有「C n羅」、「足球」標籤的文章在進行推薦時,系統會將其自動匹配給帶有「C 羅」或「足球」標籤的用戶,這便是推薦引擎的個性化推薦。
n當然,系統推薦的實際情況會遠比這複雜得多,但推薦的基本原理便是:
n系統先通過數據來來給內容和用戶打上各種標籤,然後通過演算法將內容標籤跟用戶標籤進行匹配,接著根據第一批推薦情況,決定後續的推薦量,這個下面說。
n3)你的文章是如何被推薦的?
n為讓受歡迎的內容被更多用戶看到,不受歡迎的內容不佔用過多推薦資源。頭條號文章在推薦時,會分批次推薦給對其感興趣的用戶。
n如何理解分批次推薦呢?
n文章首先會被推薦給一批對其最可能感興趣的用戶(這批用戶的閱讀標籤與文章標籤重合度最高),這批用戶產生的閱讀數據,將對文章下一次的推薦起到決定性作用。
n數據包括點擊率、收藏數、評論數、轉發數、讀完率,頁面停留時間等,其中,點擊率占的權重最高。
n這很好理解,能吸引眾多用戶點擊的文章自然會被認為更可能是好文章。
n文章的首次推薦,如果點擊率低,系統認為文章不適合推薦給更多的用戶,會減少二次推薦的推薦量;如果點擊率高,系統則認為文章受用戶喜歡,將進一步增加推薦量。
n以此類推,文章新一次的推薦量都以上一次推薦的點擊率為依據。此外,文章過了時效期後,推薦量將明顯衰減,時效期節點通常為24小時、72小時和一周。
n因為這種擴大推薦的機制,你想獲得更多的閱讀量,就必須努力把各維度閱讀數據(點擊率、用戶閱讀時間、收藏數、評論數、讀完率等)維持在高位水平。這也就上面官方的一些標準。
n其中,至關重要的當然是點擊率,也因此,標題和封面圖的重要性便不言而喻。這也是今天注意力稀缺時代,文章獲得好的傳播的關鍵要素。
n雖然如此,但除了點擊率,有一個特別重要的點總是被大家忽視,就是:
n文章所對應的標籤,直接決定了匹配的相對應標籤的用戶量。有的標籤本身就對應很大體量的用戶,而有的標籤對應人群很小,就算點擊率再高,天花板也很低。
n這就是為什麼很多專業性文章閱讀不高,而情感雞湯、娛樂八卦、社會新聞的推薦一般會很高。這也是為什麼大家都會去追熱點,因為熱點標題對應的用戶群體非常大。
n所以說,我們選題,包括文章標題以及內容裡面的關鍵詞使用,一定要基於用戶量大的標籤,這樣可以獲得更多的推薦量。
n之前今日頭條官方就發過最受歡迎的一些標籤,這些都是一級標籤,你有沒有經常使用?
而且,今日頭條還專門推出了熱詞分析功能,幫助大家找到不錯的標籤。利用熱詞分析功能可以大大增加系統推薦量,提高文章的閱讀量。
n另外,今日頭條是有文章分類的,在你的文章類型的大類下,手機查看相關文章,底部都有對應文章的標籤,多收集這些標籤,積累自己所屬行業的標籤庫。
n一定要記住,你的文章所在的標籤一定需要匹配到更多的人群。
n3 為什麼會產生推薦效果不好的情況?
n常有作者抱怨自己的某篇文章推薦效果不好,或者對自己的文章閱讀量不穩定感到焦慮。
n前面我們知道,文章的閱讀量由系統推薦量直接決定,而推薦量又取決於上一輪推薦的點擊率。
n因此單篇文章推薦效果不好,原因無外乎三大類:點擊率低、推薦量低、閱讀量低。
n1)點擊率低
n前面說了,文章推薦至關重要的是點擊率,新一次的推薦量都以上一次推薦的點擊率為依據。
n為了提升用戶體驗,機器會減少那些不受歡迎的內容(即點擊率低的內容)的推薦量,如果點擊率持續走低,推薦量也相應地持續減少。
n一般來說,如果初次點擊率不高,就很難再有較高的推薦量和閱讀量。
n而點擊率較低可能是如下原因導致:
n● n帳號內容垂直度較低,沒有及時推薦給相應的用戶。
n你是體育類帳號,這一次卻發表了娛樂類內容。對於這種不屬於帳號擅長領域的文章,系統需要重新識別分類再進行推薦,這在一定程度上會延長推薦時間,不能保證在規定時效內,推薦給相應的用戶。
n● n文章內容自身問題,導致點擊率低。
n● n標題平淡,沒有起到吸引讀者閱讀的作用。
n● n配圖無吸引力,文章配圖與內容相關度不高,或者前三張圖片質量較差。
n● n內容過於低質,引起讀者反感甚至投訴。
n木木給大家一個方法,在找選題、寫文章、定標題時,可以先通過今日頭條媒體實驗室搜索一下選題的關鍵詞來判斷熱度,還可以查看相關關聯詞。
n比如,我們將「張馨予」和「范冰冰」這兩個詞進行一天內熱度趨勢的比較。會發現「范冰冰」的關注熱度是高於「張馨予」的。
n那麼,如果我要寫的是關於這二個人的一個話題文章,那我會不管是在標題還是在內容中著重多出現「范冰冰」這個關鍵詞,這就會增加推薦量,也會更可能受到用戶關注,從而提高點擊率。
n所以說,今日頭條的文章發布以及標題選擇也是可以科學運營的,不一定只是盯著自己的號,也可以看看大環境是怎樣的。
n2)推薦量低
n推薦量是決定閱讀量大小的重要因素,推薦量低的主要原因有:
n● n點擊率過低,將會影響推薦量,這個不用多說,上面強調過。
n● n潛在的用戶群過小,推薦量不高。
n如果潛在的用戶群實在過小,機器將很難挖掘到潛在用戶,推薦量自然高不了。而潛在用戶群過小有如下原因:
n話題過於冷門、生僻;涉及領域過於專業,晦澀難懂,與主流群眾有一定距離。
n這個上面已經說了,有的文章標籤本身就對應很大體量的用戶,而有的標籤對應人群很小,就算點擊率再高,推薦量也不會高到哪去。所以,一定要有意識的選擇或加入用戶量大的標籤。
n● n內容供過於求。
n同一領域或話題相似內容過多,出現了供過於求的現象。如,關於當下熱點話題的談論,受眾雖然足夠多,但是內容供給總量實在龐大,相應地每一篇內容得到的推薦量也就比較少。
n這一點很容易理解,說白了就是內容扎堆、僧多粥少。那麼系統就只有2個選擇,要麼只推薦其中一部分內容,要麼都推薦但是推薦量會少,因為不能重複給1個用戶推薦1樣的內容。
n● n消重機制會影響推薦量。
n而就算內容不是供過於求的,也會有消重機制的影響,已經有推薦過相似的內容就不會再過於推薦了。
n文章非原創或者沒有在頭條號首先發布,再或者和其他話題相似度過高,文章都可能會被消重,從而影響推薦量。
n● n時效短,影響推薦量。
n時效性短的文章,實際推薦時間自然也短,而短時間內可能將無法獲得較多的推薦量。
n前面講了,文章是有一個時效期的,過了時效期文章的推薦量將明顯衰減,時效期節點通常為 n24 小時、72 小時和一周。
n我們也可以在選擇話題的時候,先使用熱詞分析功能,大致判斷一下熱點的持續時間。
n基本上,我們說的提高點擊率+讀完率、文章分類明確、文題一致、提高內容質量、賬號垂直度高、做好各種互動數以及訂閱數、擴大站外熱度、保持發文頻率等都是為了更好的做好推薦量。
n3)閱讀量低
n文章閱讀量低,與點擊率和推薦量有關。同時,閱讀量低也反過來會影響點擊率和推薦量。
n在推薦量增長到一定數量級之前,即使點擊率較高,文章閱讀量也不會高,因為內容並沒有得到大範圍的驗證。在後續的推薦中,如果推薦量持續攀升,閱讀量可能會穩步增長。
n而如果推薦量已經足夠高,閱讀量仍然較低,很可能是由於文章的點擊率較低。這就需要從點擊率著手。
n其實,在木木看來,主要是前2項最重要,至於閱讀量,推薦低就主攻推薦量,點擊少就集中點擊率,自然就解決問題了。
n好了,就說到這。
n能堅持看到這裡的,我想必定能有所收穫。
n總而言之,大家要明白,今日頭條上的文章是經過發布——審核——識別消重——推薦——點擊閱讀——用戶反饋的過程,知道這個後大家才能根據每個環節各個擊破。
n特別需要注意文章以及用戶對應標籤,文章推薦量和它有點,點擊率和它有關,閱讀反饋也和它有關,不重視不行。
n最後,祝大家通過海量流量的今日頭條,獲得海量的推薦量,再獲得海量的閱讀量。
n要是覺得有幫助,大家還是能收藏的收藏,能點贊就點贊,能分享就分享吧。
木木老賊(公眾號ID:mumuseo)
這是一個什麼都談談的營銷運營公眾號,新鮮、有趣、有料。多一點真誠,少一點套路,給在理想道路上努力打拚的營銷人,加點燃料。
推薦閱讀:
※做一件在後青春時代里最值得驕傲的事!
※你說我是佛系運營,而我身上卻有你的影子
※網易雲音樂的商業化之路及未來猜想
※運營簡史:互聯網運營20年的發展與演變
※我們就是要送你好多好多的錢