【敵後武功團紀念文章】 20140621 夢想與前行:一名數據人的自白

【求職招聘敵後武工團】群微信 - 「生活那些事」

2014-06-21【職場思想家】夢想與前行:一名數據人的自白

本版責編:Jacky Bill

作者是誰?

不離不棄,現為奇虎360數據分析師,曾就職於中國傳媒大學網路輿情研究所,涉獵市場研究、網路輿情、網站數據、微博數據以及移動app數據,技術出身的數據分析從業者,以業務為主導的數據分析踐行者。

前段時間看微博話題討論有些迷茫,有些已經被同行確認無疑的觀點竟被反覆強調,比如「數據挖掘/分析要懂業務」、「產品是數據價值變現的一條有效渠道」,觀點沒錯,但聽多了的感覺就好比一些健康養生專家在闡述吃飯對於健康的重要性,有些會質疑自己的認識,難道別人一直都不是在吃飯?還是說難道自己一直是個另類?任何觀點與認識都是來自個體的經歷,經歷是前因,觀點是後果,後果不重要,了解前因才是關鍵,只有知道前因,才能更好的對觀點進行學習、轉化與吸收。因此就有了這篇文章的動因,分享一下個人的數據從業歷程,有些主觀,但不失真實,拋磚引玉,期待交流。

一、不懂商業,技術就僅僅只是技術

正如微博名「@數據挖掘_PHP」所示,在沒進入數據行業之前,我是一名標準的PHPer,在一家公關公司從事營銷傳播的技術支持工作。有一次項目是網站建設,在進行類目規劃時,發現竟然還有數據監測和諮詢公司,不明覺厲,數據監測?諮詢?西服領帶?空中飛人?哇~高端大氣上檔次!從那以後開始對數據公司的關注,一個月後進入到一家輿情諮詢公司A,開始了數據之旅。需要提及的是,在公關公司我的認識是,不懂商業,技術就僅僅只是技術。商業是什麼?商業是別人有某種願意付費交換的需求,如果只停留在後端,你永遠聆聽不到這種需求,再大的金礦此刻也只是一朵浮雲。有一個深刻的經歷,當時為了豐富網站,需要採集百度內容,不停的拼接模擬關鍵詞結果url,無意發現可以更改搜索框的下拉聯想,然後就沒有然後了,僅是知道這麼個事而已,後來在與客戶閑聊的過程中得知,他們一直在付費尋找這種操作方式,通過改變下拉聯想來增大品牌曝光(變相廣告)或者減小品牌曝光(危機處理)。從這個例子來看,技術的高深與價值的大小不是正比關係,需求是技術轉變為價值的催化劑,試想下如果沒有聽到這個需求,這個信息可能就駐留在我的腦海,直至遺忘,當然,在技術人眼裡,這件事確實沒啥可傲嬌的技術難度。作為一名程序員,為了所謂的性能、封裝、代碼潔癖,在技術海洋里深鑽,或許可以成為一代大牛,同時也會被大公司綁架,畢竟不是所有IT公司都有大流量並發的,這種帶有上吊性色彩的自我感動使得碼農一邊在拚命各種學習,然後一邊在吶喊「難道我的未來就是coding么」,不,我不要這樣!

二、不懂包裝,數據就僅僅只是數據

在A公司主要負責輿情數據的採集工作,通過關鍵詞的定製彙集各大網站的信息進行匯總、統計,進而提供給分析師撰寫報告。說的直白點,通過網路上的公開信息,進行搜集、整理、二次包裝出新的內容閱讀物並進行售賣,一套商業流程結束。也就是說,在輿情產品的生產體系里,原材料是免費的,產品是付費的,如何提高籌碼就是中間的搜集、整理環節,於是便學會了商業包裝、學會了產品設計、知道了方法論。

商業包裝:從源數據到售賣產品,中間還有很多步驟,如何讓報告更充實,顯得對得起它的標價,商務流程、外觀美化、話語話術起碼得專業;

產品設計:數據是公開的,用戶是感性的。不同的用戶群有不同的認知與使用習慣,得像市場小販一樣,看人給菜,原料就那麼點數,需要變出不同的組合維度,以供饗享;

方法論:不是隨隨便便在搜索引擎上搜到幾篇企業的負面信息就得提醒企業去做危機預警的,預警的多了就不叫預警,一定得有方法、有科學依據,同時還得給出具體的危機公關建議;

就這樣,按照碼農的自我畫像,一天不coding,蛋蛋碎到疼,時間長了,就有些不安,同時自認為對輿情的商業了解比較深刻,1、輿情監測只能告訴你有病,無法做到我有葯2、如果體檢能掙1份錢,治療能掙6份錢,國人更喜歡有病求醫,常態體檢是達官貴人(上市公司)的寵物,體檢與治療不能一起抓,否則公正性受質疑3、輿情監測不是技術派的玩物,商業環節是主要瓶頸。隨後去了一家第三方互聯網數據服務公司B,負責網站分析產品的開發和設計。

三、不懂執行,策略就僅僅只是策略

網站數據不同於輿情數據,在原材料獲取上有一定的競爭優勢,通過在各大媒體網站上的js布碼,收集到用戶的網站瀏覽數據,從而進行網站分析產品、營銷策略、流量認證、網站優化、廣告效果等業務產品輸出,在這裡,編碼能力得到進一步提高,以前是用php進行web開發,這裡是用php+shell+awk進行日誌文件的統計計算,數據更大了,對性能要求也更高了,更重要的是我的知識體系里又多了一個分支——網站數據,由於性格上的某些緣故,同時還被安排了產品經理和售前的工作任務,直接對接客戶了解需求、設計指標、規劃產品。其中,個人最有成就感的是負責某網站的音視頻評估項目,指標不多,有效播放次數(播放時間超過3分鐘的為一次有效播放)、播放時長、獨立IP數、獨立用戶數和來源,時間維度分為刻、時、日、周、月,考核對象為節目、欄目和分發渠道,網站下分多個欄目,每個欄目有自製內容節目,這些內容節目在網站上有直播、點播和視頻播放三種分發渠道,在手機APP上也有分發渠道,該項目就是通過收集這些節目在分發渠道上的用戶行為反饋數據,來給網站考核欄目組、各欄目組考核節目組使用。

這裡有幾個難點:

播放時間超過3分鐘的為一次有效播放,因此需要改寫收碼js,在播放狀態時每一分鐘回傳一次心跳數據,用來判斷播放時間是否超過3分鐘;

數據可以累加,大範圍=小範圍之和,某欄目的某月有效播放次數等於該月該欄目下的所有節目在各分發渠道的有效播放次數之和;

臨界值處理,如果某個有效播放跨時間臨界值了,9:58-10:02,播放時長4分鐘,算做一次有效播放,但在時報里,9點時段的播放時長為兩分鐘,10點時段的播放時長也為兩分鐘,各自都不計為有效播放次數;

移動終端的回傳碼定製。

畢竟考核涉及到利益,因此在指標計算以及數據的公平性上要求更加嚴格,數據上的多1少1,影響的是客戶對數據公正上的存疑,容不得半點馬虎,每月最頭疼的事就是檢查各種維度的交叉對比,看看是否一致,是這個項目教會了我對數據的敬畏。

類似的項目做多了,困擾也來了,按理說數據產品是要跟客戶做價值交換的,客戶購買炒股軟體是想要掙錢的、購買網站分析產品是想提高(購買)轉化的,但是邏輯不通,如果真能達到目的那數據公司還賣產品做什麼?直接做電商就是嘍,包括最近一些線下交流,不少同行也同樣為此困惑,自己辛勤付出的分析報告到底能為公司/客戶帶來多少的價值收益?內心自我認可,可現實無法評估,只能繼續重複。我的感受:數據分析是指將隱沒在數據中的信息,進行集中、清洗、提煉並發現策略的過程,產出是策略,策略是否有效,需要檢驗,在給出策略的同時給出執行建議過程,並協商好按照這樣的執行過程最後達到什麼狀態則意為策略有效,有了這樣的生產和檢驗流程,數據究竟是不是馬後炮也就顯而易見了,不懂執行,策略就僅僅只是策略。這裡需要提及的是,也許有人會問,如果分析人員比執行人員更懂執行了還需要分析人員幹嘛?我這裡有個比較掃興的看法:數據分析本非難事,實質是思維邏輯方法,理想的情況下是應當被融入到產品、運營、開發、財務、老總等一系列職業角色之內,只是因為數據收集、整理比較費時費力,那就招一個人負責數據收集和整理吧,邊緣與博弈,於是就發展到現在這樣一個尷尬的局面。

四、不懂人文,機器就僅僅只是機器

現在,我在一家微博數據創業公司,拿網站數據、輿情數據和微博數據做下對比,如果說輿情數據側重信息,網站數據側重用戶(行為),微博數據則是信息與用戶的統一體,更重要的是,這裡的分析維度偏重社科人文,舉個例子,網站數據是以用戶的瀏覽行為來定義cookie的興趣,微博數據則是以用戶的關注對象、微博內容、互動行為來定義興趣,微博用戶關注了什麼人,看到了什麼內容,因此發了一條怎樣的感慨,被他的小夥伴們進行互動影響又變成了怎樣的認識,他關注的人為何發布這樣的信息?是否也經歷了這樣的影響過程?……

這,絕不是簡單的線性思考方式,更多了一些複雜人性的味道,不懂人文,機器就僅僅只是機器,社交網路還有很多答案沒有解決,包括分析維度和產品模式,也這是因為此,憑添了許多探索與樂趣。

五、總結

回顧一下,我的數據從業歷程是從輿情諮詢公司切入,那裡有稍微學術點的指標體系和方法論;然後在數據服務公司提升,那裡有落地的技術實現方法;最後在微博數據創業公司回爐,將之前的知識體系進行應用和整合。一直靠近商業交易環節,所以更能深刻體會業務和產品對於數據變現的重要性。大數據變化的只是數據的存儲和技術處理環節,對於商業,最終比拼的還是產品創新和商務運營能力,如何讓數據實打實的產生價值,簡單粗暴回饋商業,願與各位一同探索,迎接數據行業真正的春天。

就在快收尾的時候,看到Q群有人分享了這樣一句話,「人生是一場艱難的考試,很多人沒考好是因為他們一直在抄別人的答案,卻沒注意到每個人的卷子都不一樣...」,本文的目的就是展開我的考卷,也期待您的考卷!

《生活那些事》微信君,帶你創造優質生活!

掃描以下二維碼就可以直接關注我們哦:

如有小夥伴希望跟《生活那些事》分享或吐槽,歡迎回復微信聯繫我們,等你呀親~


推薦閱讀:

霍克斯灣旅行筆記、拾遺及隨想 (上)
武則天是被妖魔化了,還是被美化了?
我沒有科技思維——《前哨》第二季有感
一月讀書總結
這麼水靈的瓜壺是怎麼做出來的?

TAG:經驗分享 | 原創 |