KPI&項目&技術&產品
KPI&項目&技術&產品
這半年,經歷了一次以KPI為核心的戰鬥,過程中,在項目、技術、產品三方面有深刻體會。工作三年來,也不再過於迷信和迷失於技術本身,而會在項目和產品方面綜合思考,這半年的戰爭,感覺是項目、技術、產品三者相互配合成功的實踐。
我們小組負責的是推薦和榜單項目,當時定的KPI,是點擊量做到日均幾十萬(避免涉密,這裡不說具體數字)。雖然我知道這個數目很大,因為是從0做起,但我並不是很害怕或者糾結,因為我知道這個KPI不僅與自己有關,還有老大背著,老大都不怕,我怕什麼呢?
好了,簡要介紹一下推薦和榜單兩個項目是幹嘛的。我們做的是POI詳情頁的優化,推薦和榜單是為了幫助用戶做決策的,為了用戶更好的選擇。舉個例子,假如一個用戶進入了一家日本料理的POI詳情頁面,除了本身POI的信息,我們還會推薦一些餐廳,這些餐廳跟當前餐廳相似,可能比當前餐廳優質。此外,還會掛一個這家日本料理所在區域的日本料理的榜單,榜單中的POI是一些優質餐廳。相對於相關推薦,榜單是一種泛推薦,是基於類別和區域兩個置信前提來進行推薦,而相關推薦會考慮更多比如距離,價格等等相關性。
這兩者都是放在詳情頁,為的是讓用戶更好的選擇,提高活躍度。量化的目標就是點擊量。
最開始做的是POI的相關推薦,其實當時有點迷失。因為用戶的行為數據過於稀疏,傳統的協同過濾或者關聯規則不怎麼有效。後來產品進來了,提出了做一個相似價格的餐廳推薦需求。我們照的需求,做了一個相似價格的餐廳推薦。結果產品不滿意,說一個中餐廳你給我推薦一個蛋糕店,不合理啊。然後我們反駁,不是相似價格嗎,它們兩者價格比較接近啊。後來老大提醒我們了,讓產品去想策略,肯定不靠譜啊。我們就開始學聰明了,不能簡單直接翻譯產品的需求,要結合用戶本質的需求來思考,而且產品也不是神,她們也會犯錯,甚至她們沒我們聰明。於是,我們重新構思我們的餐廳推薦,結合我之前做推薦系統的技術積累,我們考慮了比如標籤等更多特徵。關於用戶行為,我們換了種用法,我們以用戶去了又去定義為正樣本,去了沒去定義為負樣本,用邏輯回歸去擬合這種行為。當然,這種方法自己的原創,而是參考了天貓的相似商品推薦來改造。後來,多次迭代,多次撕逼。產品還是不滿意,因為推薦結果不符合她的預期。我們已經僵持了兩周了,老大看到不對勁,就對產品說:直接上,有問題所有後果我來承擔。其實,產品的擔心並非無理取鬧,因為她怕上線後沒人點,或者被人吐槽。(後來的結果證明她的擔心是多餘的,或者她的個人感性思維評估標準是錯誤的。推薦的點擊率還是點擊量最後都是很可觀的。)老大的這一舉動,也讓我很佩服的他,不僅讓我們有種「被保護」的感覺,而且也體現出了他之前讓我掌握的項目能力。項目如果因為一些細節被卡主,無法正常進行,KPI是無法實現的。老大私下也跟我們說,其實產品沒什麼「大局觀」,我們必須圍繞著KPI來打。
深知KPI的重要性,我也學會了掌握老大對項目節奏的把握技能。開始,我一直在構思相似餐廳該怎麼優化。比如加入用戶定位數據,將定位的經緯度和POI關聯起來,用戶對POI的行為數據就豐富了。再比如通過word2vec,lda等演算法來挖掘菜品的關聯性,從而計算餐廳的相似性。還有,用戶評論信息的標籤化處理,評論行為進行協同過濾。想到的這些細節,是為了提高相似餐廳推薦的點擊率。而老大並非這麼想的,他想到的是擴類別,挖需求挖場景,除了餐廳有相關推薦需求外,其他POI呢?(後來我也才發現老大的遠見,其實推薦的點擊率當時不低了,我們的KPI也是點擊量而不是點擊率)推薦要做擴類別,挖需求挖場景,對我們來說,就是規模化生產的問題了。迫於類別太多,需要快速開發的壓力,我當時構想了標籤關聯矩陣的思路。標籤關聯,其實是傳統協同過濾的信息層級泛化應用,用戶對POI的行為矩陣稀疏,但是映射為用戶對標籤的行為矩陣就不稀疏了。通過用戶對標籤的行為矩陣,計算出標籤之間的關聯性。然後推薦時,通過標籤的關聯強度來進行POI召回。標籤關聯矩陣的提出,不僅算是協同過濾應用的創新,更是工程上規模化生產數據的一大利器。推薦項目也逐步上線,點擊率和點擊量都很可觀,點擊率15%-25%,業界很多推薦系統都沒這水平,點擊量當然超乎預期。當時上面的老大把希望賭在了榜單項目上,完全沒想到推薦效果這麼好。而推薦項目僅僅是我帶著兩個剛畢業一年的同事做,我負責策略演算法和工程上的指導,他們是開發主力。
後來,推薦的推進只是重複性生產工程上的問題,主要技術難關不存在了,老大也逐步讓我去幫忙榜單項目。其實開始我是不願意的,但老大也揣測到我的心思對我進行了安慰,我也逐步去習慣。當然,在榜單項目中我也不是白混的,技術上,我會關注業界怎麼做排行榜,排行榜有什麼演算法,也接觸到了PCA,層次分析法,威爾遜置信區間等等,並應用到了項目中,後續會在寫一篇關於排行榜的技術文章。項目上,也學會了一些推進方法,比如盡量找一些跟你利益相關的人一起推進。業務上,有了一些個人思考,比如榜單的個性化或者區域化透出,榜單用戶的特徵聚類分析,榜單潛在用戶挖掘,榜單用戶潛在需求挖掘。當然,業務上這些想法因為小組拆解我沒機會親自經歷了,但是這些思考讓我感覺自己很有進步,並且我把這些思考通過分享形式傳達給了同事,希望他們最後會實現。
國慶期間,我們的點擊量超乎預期,KPI也順利完成。國慶後回來,先前以為可以洗洗睡了,沒想到項目小組被拆解了,我和幾位同事要跟老大做新項目。也許後續,會接觸一些數據變現的商業化項目,比如廣告系統。我知道,這也許很艱難,但無論結果如何,過程中肯定讓我個人大有長進。n9月份集團的幾天數據大學的培訓,我也學了不少知識,最後,對電商推薦,個性化運營,商業模式思考,用戶增長,深度學習等課程斷章取義,總結成PPT,就業務問題和數據建模,特徵工程三方面跟小組吹了一下牛逼。希望將來在業務實踐中也能應用到。
本文作者:linger
轉載須註明出處
歡迎關注公眾號:數據挖掘菜鳥【公眾號ID:data_bird】
關注大數據,數據挖掘,機器學習,深度學習
推薦閱讀:
※UCB演算法升職記——LinUCB演算法
※【推薦系統那些事兒·二】常用推薦策略介紹
※【博客存檔】Machine Learning With Spark Note 2:構建一個簡單的推薦系統
※【翻譯+批註】亞馬遜推薦二十年
※推薦系統從入門到接著入門