短視頻類信息分發平台如何引爆用戶流量?內容演算法為你揭秘
文/閆澤華
對於演算法分發很多人會有所誤解,這或許源自遠觀而缺乏了解,才會覺得演算法猛如虎。而當你走近了演算法分發,有了一定的了解之後,可能會有重新的認知:演算法如虎,細嗅薔薇。
本期的數據俠實驗室,DT君邀請到了簡書籤約作者、知乎知識市場產品總監閆澤華,為大家分享如何利用演算法,將內容轉變為價值。
演算法分發知多少?
儘管演算法分發中應用了各種高深的演算法,但其基礎原理卻是樸素的:更好地了解待推薦的內容,更好地了解要推薦給的人,才能更高效的完成內容與人之間的對接。
從這個角度來看:斷物識人,是一切推薦行為的起點。
對於斷物識人,我們可以將它理解為打標籤的過程。標籤是對高維事物的降維理解,抽象出了事物更具有表意性、更為顯著的特點。在不同的業務場景下,我們會選擇不同的標籤進行使用,來對內容和用戶進行標註。
在內容畫像層面,以音樂為例,最典型的有兩種標籤產出的方式:
專家系統:潘多拉(Pandora)的音樂基因工程(Music Genome Project)。在這項工程中,歌曲體系被抽離出450個標籤,細化到如主唱性別、電吉他失真程度、背景和聲類型等等。每一首歌曲都會被經由工作人員耗時30分鐘左右,有選擇性標註一些標籤,並以從0到5的分值代表這一標籤的表徵程度。
UGC產出:在豆瓣,給音樂打標籤的活則從專家產出,轉為了普通網友貢獻。群體的力量為豆瓣積累了大量具有語義表意性的標籤。當然,由於用戶的多樣性和編輯的開放性,用戶標籤系統需要經過特定的清洗和歸一化才能投入使用。
在用戶畫像層面,可以分為靜態和動態兩部分。
用戶畫像中靜態的部分比較好理解,即你的設備信息、地理位置、註冊信息等等,這些可以被理解為是業務無關的信息。具體到業務場景中,用戶產生了更多的行為,就生成了業務相關的動態信息,即利用人的各種顯式和隱式行為來對用戶的偏好性進行的猜測。
以知乎讀書會為例,你的顯式行為是點擊、收聽、評分、評論等等;隱形行為則是收聽完成度、是否有拖拽快進、頁面停留時長等等。
通常,由於顯式行為不夠豐富,我們往往需要使用隱式行為來擴充我們對於用戶的理解。完播率、是否快進、詳情頁停留時長等指標,都會被系統統計,用來判斷你是否真的喜歡某個人的講解、喜歡某本書的內容。
在內容畫像的部分,可以看到一篇文章通過文本分析進行了一級和二級分類,並抽取出文章內的關鍵字、實體詞,進一步的還會通過聚類的方式,將這篇文章與其相似的內容聚成一個簇類。之所以會有聚類,是因為專家系統的分類體系一定是對於變化不敏感的,響應不及時的,而聚類能夠挖掘出更多內容的隱含信息。
在用戶畫像的部分,「今日頭條常用的用戶標籤包括用戶感興趣的類別和主題、關鍵詞、來源、基於興趣的用戶聚類、各種垂直興趣特徵、以及性別、年齡、地點等信息。性別信息通過用戶第三方社交賬號登錄得到。年齡信息通常由模型預測,通過機型、閱讀時間分布等預估。常駐地點來自用戶授權訪問位置信息,在位置信息的基礎上通過傳統聚類的方法拿到常駐點。常駐點結合其他信息,可以推測用戶的工作地點、出差地點、旅遊地點。這些用戶標籤非常有助於推薦。」(摘錄自今日頭條推薦演算法原理全文詳解——曹歡歡博士)
內容畫像和用戶畫像,是一個相互影響的循環系統。
內容畫像決定人的畫像,自然是最容易理解的。在音樂場景下,你收聽、收藏、評分了很多爵士類的音樂,那麼系統就會判定為你是一個喜歡爵士音樂的用戶。在讀書的場景下,你閱讀、收聽了哪些書籍,哪些書籍聽完了、哪些書籍重複收聽了很多遍,都會影響系統中,你的用戶畫像。
因此,「你的選擇決定你的畫像」可以說絲毫不為過。
而反過來,人的畫像也會影響內容的畫像。我們可以看作是基於用戶的行為,對內容做出的後驗投票。在一個大體量的視頻上傳體系里,我們基本放棄了依賴人工打標籤的方式,而轉而利用用戶的播放行為來試圖猜測內容屬於哪一類。一個典型的Case:死神來了。看標題的文本信息,最大概率就是一部電影,但事實上觀看這個視頻的大面積是喜歡獵奇類視頻的用戶,深挖內容才會知道,這其實是一個車禍視頻集錦。
協同過濾,應用群體智慧
如前所述,標籤是我們對事物的抽象理解,那有沒有一種方式能夠讓我們放棄標籤呢?以人的行為來標記內容,這就是協同過濾的基礎思想。
舉一個生活中的場景,初次為人父母,「無證上崗」的新手爸媽們內心是激動而又惶恐的。打聽,成了他們育兒的重要法寶之一。「你家寶寶用的是什麼沐浴液啊、你們有沒有上什麼早教班啊…」親子群中,無時無刻不在發生這樣的討論,這樣的討論也構成大家後續消費決策的主要因素之一。
這種基於人和人之間的相互推薦固然是弱社交關係分發的一種形態,但是促成大家有價值信息交換和購買轉化的,其實是人和人之間的相似點:為人父母、擁有相似的價值觀和消費觀。
把用戶的消費行為作為特徵,以此進行用戶相似性或物品相似性的計算,進行信息的匹配,這就是協同過濾(Collaborative Filtering)的基礎思想。
協同推薦可以分為三個子類:基於物品(Item-based)的協同、基於用戶(User-based )的協同和基於模型(Model-based)的協同。
基於用戶的協同,即切合了上面的例子,其基礎思路分為兩步:找到那些與你在某一方面口味相似的人群(比如你們都是新手爸媽,傾向於同一種教育理念),將這一人群喜歡的新東西推薦給你。
基於物品的協同,其推薦的基礎思路是:先確定你喜歡物品,再找到與之相似的物品推薦給你。只是物品與物品間的相似度不是從內容屬性的角度衡量的,而是從用戶反饋的角度來衡量的。使用大規模人群的喜好進行內容的推薦,這就是在實際工程環境里,各家公司應用的主流分發方式。
基於模型的協同,是應用用戶的喜好信息來訓練演算法模型,實時預測用戶可能的點擊率。比如,在Netflix的系統中就將受限玻爾茲曼機(Restricted Boltzmann Machines, RBM)神經網路應用於協同過濾。將深度學習應用於基於模型的協同,也成為了業界廣泛使用的方式。
以協同的方式,通過用戶行為的聚類發現許多隱層的連接。
以讀書會的場景為例,我們邀請不同的名家來領讀書籍。從領讀人的角度,更容易直觀的將同一領讀人的作品視作一個聚類,比如馬家輝老師領讀的《對照記》、《老人與海》兩本書,通過人工預判的前置規則,我們很容易將這兩本領讀書音頻推薦給同一類用戶。
但是,通過協同的方式,我們會發現喜歡馬家輝老師領讀作品的用戶,同時也會喜歡楊照老師領讀的《刺殺騎士團長》一書。這種聯繫,是很難通過標籤信息發現的,只有通過用戶的行為選擇,才會建立聯繫,提升內容和用戶之間連接與匹配的效率。
從冷到熱:內容和用戶在分發中的生命周期
作為連接內容與人的推薦系統,無時無刻不在面對著增量的問題:增量的用戶,增量的內容。
新的用戶、新的內容對於推薦系統來說都是沒有過往信息量積累的、是陌生的,需要累積一定的曝光量和互動量(閱讀、分享等)來收集基礎數據。這個從0到1積累基礎數據的過程就是冷啟動,其效果的好壞直接關係到用戶端、作者端的滿意度和留存率。
如果我們假設一篇新內容要經過100次閱讀才能夠得到相對可信的內容畫像,新用戶同樣需要完成100次閱讀之後才能夠建立起可用的用戶畫像。那麼一個最直觀的問題就是:怎麼樣達成這100次有效的閱讀?這就是冷啟動面臨的問題。下面我們從內容和用戶兩個維度來分別論述。
在推薦系統中,通過分析一篇內容的標題、關鍵字來確定要向哪個目標人群進行探索性展示,藉由探索性展示完成了從0到1的用戶反饋積累過程。在這個冷啟動過程中,如果沒能得到足夠正面的用戶反饋(點擊行為和閱讀體驗),系統就會認為這篇內容是不受歡迎的,為了控制負面影響,就會逐步降低這篇內容的推薦量。
反之,如果內容在冷啟動過程中順利找到了自己的目標人群,收穫了很高的點擊率,就有可能被推薦系統快速放大,具有了成為爆款的可能。因此,冷啟動決定一篇內容命運的說法,可以說絲毫不為過。
而對於用戶冷啟動,推薦服務的是一個大目標:用戶的留存率。只有保證了用戶留存的前提下,才會考量推薦的興趣探索效果如何,是否在有限的展示里全面探索出了用戶的偏好。對於慢熱型的用戶,我們並不急於獲悉他的方方面面,而是以「留住用戶」作為第一目的。
時下,最火熱的莫過於快手、抖音類的PUGC視頻應用了。那麼,這些短視頻內容的推薦方式是什麼樣的呢?
回歸到豐富先驗信息、依賴後驗信息的角度來闡述整個通用的流程。
一個短視頻應用裡面,大體上會有三類人:半職業或職業的生產者、工具的使用者、短視頻的消費者。從消費性的角度來看,大概率是第一類人生產,第三類人消費。先驗信息就是儘可能挖掘出第一類人生產內容的固有特徵,比如作者是誰、配的音樂是什麼、是否有參與活動話題等等,對於足夠的頭部生產者還可能會以運營介入的方式人工標註,去完善先驗信息。
客觀上說,小視頻的先驗信息是遠小於文本內容的。從信息量的角度來看,我們將其類比微博類的短文本內容或者全圖片內容可能會更合適。先驗信息的缺乏,就會更依賴協同演算法支撐下,用戶參與行為的後驗信息的補充。
將一則小視頻冷啟動推薦給特定類別的用戶來查看,從用戶角度去統計不同特徵、不同聚類用戶的有效播放,從而以用戶的行為去刻畫小視頻的特徵。
比如,時下很熱的海草舞,不同的生產者都會上傳類似主題的視頻,哪個更好?在業務場景里,真正值得依賴的一定是普通用戶觀看行為的投票,才能選擇出更值得擴散內容,優化全局的效率。
三分天下?編輯、演算法與社交
不誇張的說,演算法分發將是未來信息分發行業的標準配置。
為什麼這麼說?因為演算法是個筐,什麼都能往裡裝。在內容展現和推薦的過程當中,可以參考下述公式:演算法分發權重=編輯分發權重 + 社交分發權重 + 各種演算法產出權重。
將任意一個權重設置為1,其他部分設置為0,演算法分發系統就會變成一個標準的編輯分發系統或者是社交分發系統。也就是說,演算法分發的基線就是編輯分發或社交分發。從這個角度來看,只要演算法應用的不太差,基本上引入演算法分發一定是正向。因為它在有限的貨架里,圍繞用戶展示了無限的貨品。
在業務層面,我們通常會複合型使用三種分發,在不同的環節應用不同的因素,才達到最好的效果。
以知乎讀書會為例,我們將其劃分為:內容生產、用戶觸達和反饋改進三個部分。
在內容生產中,為了保證調性,一定是需要引入編輯專家去選人、選書的。選擇的書是否有價值,選擇的人是否是行業專家而非職業的拆書人,都是體現產品價值觀判斷的事情。
進入觸達環節,人工干預的作用就會相對弱化。舉一個例子,運營一定會有今日推薦的需求,推薦給用戶今日讀書會上新了什麼大咖領讀的書籍。比如,一本物理學的書籍,由一位物理學大咖進行解讀。從編輯的角度,領讀人是大咖,書是經典,編輯權重一定非常高。
這聽上去似乎很合理,但當你進入用戶的場景時,就發現有點差異:首先,用戶不是每天都來的。如果他一周來一次,在他沒來的這一周內同樣有文學、互聯網、藝術等專業人士的領讀,你該給他的是今日推薦,還是本周推薦呢?進一步考慮到用戶偏好問題。你是應該把物理學大咖的內容強加給他,還是推薦給他一個朋友們最近都好評的一本領讀書(社交分發),又或者是他自己已經標註了「想讀」的一本藝術類書籍的解讀呢?
當我們收集到了足夠多用戶數據的時候,又可以反過來影響內容的二次迭代,編輯的作用又凸顯了出來,結合數據的反饋來對內容進行調整:內容的播放完成率為什麼低?是稿件問題,還是領讀人語音的問題,是否需要重新錄製等等。
演算法的價值觀
演算法有沒有價值觀呢?演算法沒有價值觀,演算法背後的人卻是有價值觀的。
因為我們優化推薦系統,一定會有一個數值目標。這個數值目標的合理性決定了整個推薦系統的合理性。單獨以點擊為優化目標,一定會導致標題黨泛濫;點擊加時長目標能夠一定程度抑制標題黨的產生,但是也有可能導致用戶多樣性的喪失。在這裡舉兩個內容消費的場景,我們可以通過這兩個場景一窺各個內容分發產品的調性所在。
新用戶冷啟動:
大家可以以新用戶的身份去嘗試各種內容消費服務。比較之下,你就知道各家的價值觀怎樣的了。因為新用戶是通過不同渠道獲取的,你獲取到的是怎樣的用戶,你就會推薦怎樣的內容;進一步的,基於馬斯洛需求模型,越底層的內容越有更廣泛的受眾。這就是為什麼很多小視頻應用,打開來之後,全都是白衣校花大長腿的原因了,人性爾。
推薦多樣性:
多樣性是另一個評估分發產品調性好壞的所在。喪失多樣性,深挖用戶的局部興趣點,一定是短期收益最大化的。比如我喜歡看科比,那麼你把科比的比賽視頻推給我,可以讓我刷到深夜兩點;但是從一個產品的長線來看,我們需要更長久的留住用戶,而不是短期讓用戶沉迷。在短期時長和長期留存中,就依賴於產品設計者的價值觀判斷了。
不同平台下的自媒體生態
對於平台來說,創作者是什麼?
如果把平台比作一個商場的話,不同的平台會有不同的選擇,最典型的兩種類型莫過於:自營 V.S 第三方運營。
一種情況下,整個商場全部是直營的店鋪。在這樣的平台下,每個貨架都是商場自營,所有的創作者對於商場而言,都只是供貨商。
另一種情況下,商場只提供位置,所有交得起入場費的店鋪都可以入駐。在這樣的平台下,每個貨架都是創作者自己運營的。
直營商場的好處當然是體驗可控、甚至於能夠在某個特定垂類人群身上做到近乎可量化範圍內的極致。由於其收取的是商品流通中的利潤,所以在短期內可以攫取巨大的紅利,並用這些利潤去給商場自身打廣告,做新客獲取。
但這樣做的壞處也很顯然,就在於供貨商的角度缺乏靈動性,只作為供貨商的創作者,由於缺乏足夠的利潤激勵,很難生長出全新的品牌。
開放給第三方運營的商場,其好處當然是供貨商的靈活性和多樣性,商場賺取的是房租而非商品流通過程的利潤。一個常見的問題是,這種完全開放給第三方運營的商場是否會用戶體驗崩塌,比如會有各種在商場入口發小廣告的,以各種圖謀短線的方式來吸收商場的流量。這就是局部失控與全局可控的關係。
在國內,全部直營的商場比比皆是;近乎完全開放給第三方運營的大商場,則恐怕只有微信了吧。在所有平台都在告訴你什麼是對的時候,只有微信很克制地告訴你什麼是錯的。
數據驅動自媒體迭代
站在自媒體的角度,又該如何面對平台?如何應用數據驅動的方式,更加目標導向的面對不同平台呢?
首先,自媒體面臨的問題是平台選擇。由於不同的平台有不同的分發規模和不同的發展階段,所以,更應該選擇適合自己品牌調性的平台,選擇符合自己長線商業化變現角度的平台。要區分清楚,哪些平台是叫好不叫座、哪些平台是叫座不叫好。
如果做電商導向的自媒體,那麼基本上微博微信是必選項。考慮到目前各個平台相對封閉,不提倡向微博微信導流,那麼其在其他平台可能更多的在於曝光量和品牌建設的貢獻,而不會對電商的銷售轉化有太大的貢獻。
但對於承接品牌廣告的自媒體而言,其利潤更多的和內容的傳播量有關,在傳播量導向的角度來看,就應該更多的選擇和自己品牌調性相符的、哪怕是一些垂直類的內容分髮網站。通過彙集全網各平台的流量,來實現自己對廣告主的全網閱讀量(播放量)的承諾。
因為每個平台的投入都需要牽涉到運營人力,所以如果一個平台的投入產出比不能夠達到預期,就應該主動止損,避免進一步的資源投入。
在自媒體確定了自己選擇的平台之後,就需要深究不同平台的分發特點,來進行針對性的運營從而提升自己在相應平台的曝光量。常見的三種平台:編輯分發、訂閱分發和演算法分發平台。
對於編輯分發平台,最快速的方法一定是維繫好和平台的關係。因為在這樣的平台上,其推薦位置都是人工分配的,更好的編輯關係能夠保證自媒體有更好的流量曝光。在編輯分發的平台上,時不時的會有相應的官方活動、積極地配合官方導向,就能從流量傾斜政策中獲取紅利。
對於訂閱分發平台,做粉絲,做垂直品類粉絲是不二法門。藉由微信,其實大家能夠看到一些常見的誘導分享的手段。由於微信是一個規定行業下限,而非設定上限的開放式環境。所以在這樣的平台上進行運營,首先需要保證自己有足夠高的敏感度,對於一些新的傳播形態可以及時跟進,從而最大化的獲取時間差的紅利。比如,最近的微信小遊戲,在前兩周鋪天蓋地的通過微信群分享獲得拉新機會;而最近幾日,這條通路就完全被官方封禁了。
對於演算法分發平台,儘管平台關係維護和粉絲數積累都需要,但是最需要投入的還是對於內容的包裝。因為你的內容不僅僅要抓住人的眼球,同時也要能夠對機器演算法的胃口,通過研究過往一段時間的平台熱門關鍵詞,能夠給內容的標題封面包裝提供一些借鑒。
在我看來,運營的非常好的一個自媒體品牌非二更莫屬,細細觀察,其在不同的平台上都有不同的運營策略。比如,在頭條上的分發,二更就全面的在使用雙標題、雙封面的方式進行自己的內容包裝。一些視頻內容能夠在非常短的時間內就獲得了上百萬的曝光量。
不同平台上的不同運營方式,本質上還是一個數據驅動,目標導向的過程,以下進行更細粒度的拆解。
他山之石可以攻玉,首先和大家介紹的是在國外,將數據分析指導內容生產做的非常極致的BuzzFeed。
員工總數逾千人,擁有全球新聞團隊、自家視頻製作工作室、尖端數據運算中心和內部創意廣告機構,每月全網超過50億次閱讀——這就是BuzzFeed,怎麼看都是一個龐大的媒體集團。
然而,當我們深入了解BuzzFeed的工作流程後就會發現,與其說它是一家媒體公司,不如說它是一家科技公司。「數據驅動內容創作」,這是BuzzFeed給自己貼上的標籤。
在這家公司的內容創作和分發過程中,反饋閉環(Feedback Loop)是出現頻次最高的術語:通過將市場環境和讀者反饋數據儘可能的量化和結構化,及時反饋給運營人員、內容編輯,從而構成了輔助創作的一個閉環。
由於很早就樹立了「將內容分發到用戶常駐的平台,而非吸引用戶到自己的平台看內容」的思路,YouTube、Facebook,Twitter、Vine等一眾平台都成為了BuzzFeed的戰場。為了更好的理解用戶反饋,BuzzFeed追蹤收集並匯總了各個平台上的閱讀傳播和互動數據。比起閱讀量、分享量這些結果指標,其更關心內容分發和傳播的過程。
以下圖為例:如果只看終態數據,那麼報表展示給你的無非是一篇內容從不同的平台渠道上獲取了多少流量而已(下圖左)。但是深究下來,這些流量是如何來的呢?是通過Facebook或Twitter上的分享,還是通過郵件的傳播?哪些節點帶來了更大的輻射量和擴散量?只有深入分析傳播路徑,才能給出這個問題的答案(下圖右)。
不止於結果, BuzzFeed開始探究一篇內容的傳播軌跡,他們開了一套名為Pound(Process for Optimizing and Understanding Network Diffusion)的系統,通過給同一頁面的不同分享追加不同參數的方式,來追溯內容在網路上的傳播過程。
通過這套系統,人們意識到:傳播並不是一棵簡單的傳播樹,而是一片密集的傳播森林。每一次分享都構成了一棵新樹,如果一個人的社交好友很多,那麼這個節點的一度關係觸達就會很廣。如果內容的質量一般沒有引發進一步的傳播,那麼就會止步為一棵低矮的樹;如果內容引發了大量的傳播,就會變為一個繁茂的大樹。
由於社會傳播對於內容的影響力貢獻巨大, BuzzFeed在衡量內容價值時,會更看重社交分享所帶來的閱讀量,並以名為「病毒傳播提升係數(Viral Lift)」的指標來衡量這一過程。
對於粉絲已經超過百萬、內容閱讀篇篇10W+的自媒體大號來說,這一衡量指標的制定不難理解:如果一篇內容的閱讀構成主要來自於自己的粉絲,那麼就意味著粉絲們更有可能是基於慣性打開的,但是由於內容並沒有觸及到它們的興奮點、沒能引發認同,從而失去了進一步擴散傳播的可能,也失去了觸達更多潛在粉絲的機會。
對於BuzzFeed而言,在相近的總閱讀量下,一篇「病毒傳播提升係數」更高的內容,因為收穫了更多的社交傳播而變得更有價值。有了技術追溯的支持,內容團隊才能夠總結出不同平台之上的內容偏好和病毒傳播模式。
人們往往會誇大BuzzFeed的內容三把斧「清單體、短視頻和小測驗」,卻忽視了在這些內容背後更深層次的數據支持。
具體到我們日常的內容閱讀分析和粉絲分析過程當中,有哪些可以供分析注意的數據?
對內容分析來看,可以分為一次打開和打開後的體驗。
一次打開是指不依賴於社交傳播和搜索傳播所帶來的閱讀量。對於微博微信等粉絲分發平台,是指粉絲帶來的閱讀量;對於頭條、快報等推薦分發平台,是指經由推薦帶來的應用內閱讀量。
影響內容一次打開率最直接的因素有兩個:活躍粉絲量和內容包裝。
無論是粉絲分發平台還是推薦分發平台,活躍粉絲量都會影響內容展示的基本盤,只是傳導係數不太一樣罷了;對於粉絲分發的平台,你有多少活躍粉絲就意味著有相應比例的基礎展示量;對於非粉絲分發的平台,你的活躍粉絲量會被視作你在平台上的貢獻程度和受眾情況從而影響分發權重。同樣的一篇內容,10萬活躍粉絲的賬號發布一定比1萬活躍粉絲的賬號發布會獲得更大的基礎展示量。
內容包裝影響的是從展示量到閱讀量的轉化過程,更好的標題和封面圖就像是精緻的產品包裝一樣,有助於更好的促成轉化。比如在頭條號平台上,就支持了一個非常酷的雙標題雙封面功能,能夠給創作者對內容不同包裝的機會。
對於標題,我習慣於引用咪蒙的觀點:「不能在一秒鐘看明白的標題,不適合傳播,不是讀者理解不了,而是他只能給咱們一秒鐘。」
在咪蒙的工作方式中,她會把當天寫好的內容發出來,交於自媒體小組的員工開始取標題。15-20分鐘內,每人至少取5個標題。這樣,每一篇內容背後,都有近100個標題!咪蒙隨後會從中挑出5-6個標題,放到3個由用戶顧問群里投票(每個顧問群都有人負責統計票數)。 咪蒙會參考最終的投票結果,決定用哪一個標題。這種方式,其實就構建了一個最樸素的AB系統來驗證標題對於內容一次打開率的影響。
為了便於比較,我們通常計算一次打開率而非打開量。對於粉絲分發平台,一次打開率=閱讀量/粉絲量;對於推薦分發平台,一次打開率=應用內閱讀量/推薦量。一次打開率對於不同分發模式的平台有不同的意義:
在粉絲分發的平台上,一次打開率能比閱讀量更好地衡量自媒體賬號的價值。為了保證更高的一次打開率,需要更科學地獲取精準粉絲、重視粉絲群體的互動維護,使得自身始終能夠保持較高的粉絲觸達率。
對於推薦分發平台,一次打開率考量了自媒體對平台分發特點的認知和對內容包裝功力。一次打開率(推薦點擊率)高就意味著具有成為爆款的可能。甚至會收穫比粉絲分發平台更大的閱讀量。
閱讀體驗
如果說一次打開代表了上門推銷人員成功敲開了用戶的房門,那麼閱讀體驗衡量的就是用戶是否會為這次推銷最終選擇買單。
用戶是帶著對作者品牌和對標題封面的認知預期打開內容的,只有實際消費體驗與預判一致、甚至超出預判,才算得上是好的閱讀體驗。我們之所以抵觸標題黨,並非因為它駭人聽聞,而是因為用戶抱著駭人聽聞的預期,點擊進入詳情頁之後才發現內容平淡無奇。
想要衡量消費體驗,內容的消費比例是一個重要的指標。對於圖文來說這個指標是平均閱讀進度和閱讀速度;對於視頻來說是播放進度和播放時長(因為用戶會有快進的行為,所以100%的播放進度並不意味著100%的播放時長)。平均消費比例越高,代表用戶的認可度越高、消費體驗越好。
除了內容消費比例指標以外,內容是否引發了讀者互動也是一個常見的考察角度,如評論、點贊、收藏、轉發等,這些指標的橫向對比通常用於組織內部考核不同編輯的創作能力。其中,個人建議需要額外關注的是評論和轉發兩個指標。
評論擴展了內容的深度,更多的用戶評論給正文提供了不同的視角分析和信息補充,可以有效的引發圍觀用戶的閱讀興趣,提升用戶在內容頁的整體停留時長。促進評論的提升算是有一些技巧性的部分:選題有衝突性或者有代入感,在正文中留有懸念,主動引起討論、投票,在評論區中帶節奏等等都是行之有效的方式。
轉發擴展了內容的廣度,更多的轉發能夠帶來更多面向潛在受眾的曝光,這一點對於以粉絲分發為主要模式的系統尤甚。對於轉髮指標,我們可以套用BuzzFeed的病毒傳播係數的計算方式:Viral Lift = 1 + 傳播閱讀量 / 一次閱讀量。
粉絲增長分析
對於自媒體而言,虛高的粉絲數除了忽悠投資人和廣告主以外,對自身成長是毫無意義的。想要可持續發展,只有精準的粉絲才有價值。那什麼是精準的粉絲?我想,應該是指能夠給自媒體帶來變現價值的粉絲。
粉絲增長分析,就是圍繞有變現價值粉絲算的一筆賬:如果一個粉絲能給自媒體帶來5塊的凈利潤,那麼花低於5元的成本來購買這個粉絲就是划算的。
首先,引入三個概念——LTV、CAC和ROI。
LTV(Life Time Value):生命周期總價值。一個粉絲從關注你的那一天開始到取關或者脫離平台為止,能夠帶來的收益。通常按渠道來計算,如果某個渠道或某個平台的用戶不精準、付費意願差,那麼這個渠道的用戶LTV就相對較低。
CAC(Customer Acquisition Cost):用戶獲取成本。同樣跟渠道有關,自媒體需要持續的發現低價、優質的渠道,搶佔紅利期。比如2015年初,微信廣點通渠道的公眾號漲粉,單個用戶獲取成本只有1-2塊錢。
ROI(Return On Investment):投資回報率。計算公式為(收入-成本)/成本。應用於粉絲增長場景就是(LTV-CAC)/CAC,衡量的是:你從一個粉絲身上掙到的錢,是否能夠覆蓋獲取這個粉絲的成本。
通常應該做ROI>1的事情,這樣才能夠保證業務的可持續發展。後續也都圍繞這個角度展開。
首先,現身說法,舉一個親身犯下的「人傻錢多」的蠢事。15年初,微信朋友圈集贊的路數還很火熱,我們也不能免俗,搞了三場集贊有禮的活動。三場集贊有禮的活動,表面上看起來一面光鮮,各種指標在活動日都有顯著的提升。但是興奮過去之後的分析,卻讓人笑不出來了。三次活動中,發起活動的老用戶重疊度越來越高,帶來的新用戶越來越少,同時,新用戶的次日留存情況也越來越差。
於是,我們開始反思用戶為什麼要參加集贊有禮的互動?唯利爾。
老用戶發起活動,他所帶來的新用戶無非是看一眼品牌廣告,幫朋友支持一下。如果實物獎品價值還不錯,那麼這個新用戶也會發起,但目的在於獎品而非公眾號。此外,設計過高的門檻使得有的用戶不樂意參與,有的用戶則自建了群開始互相點贊,達不到拉新的作用。
想要提升用戶增長的ROI,就必須降低新用戶中非精準用戶的比例,從而拉升渠道用戶的LTV,降低用戶獲取成本CAC。
由此入手,我們優化了轉發集贊拉新的方式,新一期集贊活動的禮品是凱叔西遊記第二部的部分章節收聽權,每個用戶只需要拉5個用戶就能獲得。因為是虛擬產品,CAC得到了顯著降低。而兒童故事音頻跟微信賬號捆綁只能自用,用戶如果不是真有需求就絕不會參與活動,從而提升了新增用戶的精準程度。在後續的此類活動中,我們都有意識的對禮品的形態進行了控制:實物禮品用於鼓勵已有的活躍老粉絲,虛擬禮品用於激活和拉新。
運營微博、微信這樣的平台,我們很容易沉迷於追求短期粉絲數字的飆漲而舉辦各種活動。某些活動拉新從CAC的角度看或許是划算的,但深究其所帶來的真實活躍粉絲,就往往會發現ROI遠遠小於1,充其量只能算是一次展示廣告曝光,做了一筆又一筆的蝕本生意。
想要算清楚用戶的ROI,有賴於用戶身份的識別和渠道的追溯。在這一點上,微博和微信的基礎建設比較完善。以微信為例,基於平台提供的二維碼,我們可以追溯不同用戶的來源並標識,就像是安卓應用下載對於不同的應用市場打不同的渠道包一樣。進而,通過平台提供的外鏈功能、私信功能,來識別用戶的活躍情況。
對於付費增粉渠道,每隔一段時間暫停一些,比較渠道暫停前後自己粉絲量的增長情況和粉絲閱讀佔比、線上活動粉絲參與量情況,建立起對付費渠道更清醒的了解。
通過數據分析的方式,能夠讓我們更加清醒的審視內容創作的消費性好壞,粉絲積累的性價比高低,從而以更經濟的方式提升自己的增長速度。
註:以上內容根據閆澤華在數據俠線上實驗室的演講實錄整理,已經本人審閱。點擊「閱讀原文」,獲取作者直播回放。想要了解更多相關領域知識,推薦購買《內容演算法》一書。
編輯 | 王旭晶
題圖 | 站酷海洛
數據俠門派
本文數據俠閆澤華,現知乎知識市場產品總監,負責知乎內容付費的產品工作。前今日頭條資深產品經理,先後負責頭條視頻、微頭條的分發策略,頭條號的粉絲生態等業務。前凱叔講故事技術負責人,前百度搜索架構工程師。
推薦閱讀: