如何成為大數據產品經理
非常基礎的入門課程,核心內容總結歸納
大數據產品是什麼?
在互聯網時代大量數據不斷被生產,引出了大數據的概念,並且越來越多的人專註於生成大數據、處理大數據。但數據本身是沒有價值的,只有數據分析師從數據中挖掘出有用的信息,大數據才被賦予了真正的「生命」,才能被稱為一種產品。
以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的信息或深刻的見地。——《大數據時代》作者:維克托 · 邁爾 - 舍恩伯格教授
一、大數據產品設計的兩個基本原則:
1、精確:數據只有精確才能讓人信服2、易用:產品只有易用才能讓人更方便去挖掘有用的信息,才能體現價值二、大數據產品的用戶
1、狹義:數據分析師和數據科學家2、廣義:產品經理、市場專員、營銷經理、機器學習專家、管理層都具有大數據分析的需求
大公司有專門的大數據產品部門,小公司和個體商戶(淘寶店主等)可以使用第三方的數據產品(比如友盟、數據魔方等)。
三、大數據產品長什麼樣?不同職位、不同技能的用戶需要不同交互形式的大數據產品。比如可視化數據報表,用戶是管理層和市場營銷人員,交互形式直觀、簡單、易讀,但是包含信息量很小。從可視化數據報表中得出某個產品的某個重要指標持續下降或持續上升,這時是無法從中找到根本原因的,由於數據量非常小,因此就需要提供其他形式,並且包含更大數據量的大數據產品。- 管理層:提供可視化數據報表,幫助管理層利用其大腦和經驗 做決策;
- 市場/營銷專員、產品經理:提供小型資料庫表/OLAP Cube,將數據導入Excel後完成數據分析工作;
- 初級數據分析師:設計更專業的數據倉庫/資料庫表,利用SQL、R完成數據分析;
- 高級數據分析師、機器學習專家:開發大數據平台的數據介面API,利用平台的超計算力進行數據挖掘。
- 獲取用戶行為的原始數據
- 上傳和處理用戶大數據(將「大數據 」分解為「小數據 」)
- 存儲大數據(不同層級的數據如何存儲)
- 設計大數據的交互方式(針對不同的用戶層次)
- 數據精確度管控(數據不精確就沒有可信度,最核心環節)
任何層級的數據產品都需要具有一定技術難度的數據流水線支撐,流水線的維護、開發就是大數據團隊的日常工作。
大數據產品經理必備技能
一、本質是產品經理- 吃透用戶(分析需求,吃透痛點,提出合理的解決方案)
- 專註細節(了解產品解決方案的方方面面,做產品的CEO)
- 團隊合作(善於與開發負責人溝通)
- 失敗的勇氣
二、核心技能
- 掌握大數據平台和數據分析專業知識
- 具備快速學習能力
三、競爭力
- 用數據做決策:數據的獲取與分析,利用相關專業知識
- 大數據前沿知識:Steaming/NRT(Near real time ,近實時)/AI,注重平時積累
- 廣闊的產品視野:與不同產品團隊合作
四、進階流程
1、起步:搭建基礎,建立信心,建立互聯網產品經理基本思維模式《人人都是產品經理 》:產品經理基礎思維建立
《結網》:產品經理與互聯網入門知識《Dont Make Me Think》:網站設計經典原則
2、積累:學習大數據基礎專業知識和用戶需求分析技能
《The Data Warehouse Toolkit》:數據倉庫設計(重點閱讀前兩章,後面為各個領域的案例)
《Hadoop權威指南》:大數據基本知識(重點閱讀前三章,熟悉名詞、概念、基本邏輯,從陌生到熟悉)《用戶力》:用戶需求分析和產品運營技能(產品經理進階書籍,用戶需求分析、產品運營基本技能)《Lean Analysis》:利用數據分析推進產品迭代(具備一定難度,建議通讀之後,在實際工作中反覆閱讀並不斷反饋)
3、實戰:提交簡歷,應聘互聯網公司(大數據)產品經理的實習崗位
產品經理實戰性非常強,學習性:實習>面試,不要害怕失敗如何打造大數據產品
一、用戶需求的收集和分析簡單舉例:開發某個產品下一階段產品功能,但資源有限,是桌面端還是移動端?看過去12個月的用戶月活躍數。雖然移動端用戶數略少於桌面端用戶數,但是移動端的用戶數增長率遠大於桌面端,因此應該將有限的資源投入到未來增長潛力更大的移動端開發。
二、四步搭建大數據流水線- 獲取用戶行為原始數據:Ingestion
- 上傳和處理大數據:Upload&Process
- 存儲大數據:Storage
- 設計大數據的交互形式:Interface
第一步,獲取用戶行為原始數據。用戶使用產品→用戶行為日誌,用戶行為日誌里的數據非常粗糙和不規範,並且包含了許多不需要的欄位。
第二步,上傳和處理用戶大數據。將用戶行為日誌上傳到大數據平台(Hadoop、Spark),然後進行數據清洗和數據聚合。數據清洗就是將原始數據中不規範和不需要的欄位進行調整和刪除。根據實際的商業需求進行數據聚合。第三步,存儲用戶數據。數據量大,操作難度高,耗費資源少,挖取的信息豐富;數據量小,操作難度低,耗費資源高,適合演示和決策。 第四步,設計大數據的交互形式。深入理解用戶需求(五個「為什麼 」?資源有限,不可能為所有用戶將數據處理成其最想要的形式),設計最適合用戶的大數據產品。最後,數據精確度的管控(具備一定難度)- 數據如果不精確,做出的決定便沒有可信度
- 在流水線的每一步都需要對數據的精確度進行衡量和管制
大數據產品應用案例
它山之石,可以攻玉
某APP連續三個月用戶活躍度都在下降,怎麼辦?
1、季度同比:去年同期也有下降嗎?
- 可視化數據報表
- 常見季度趨勢影響(節假日/大型活動流量變化、學生用戶)
如果跟去年同期季度趨勢上升,而今年下降,那證明不是季度趨勢,而是其他方面的原因造成的用戶活躍度下降,需要進一步更深入的分析。
2、多維分解:問題出在哪個維度?(把用戶月活躍度這一個核心的關鍵績效數據,拆解為影響該績效指標多個關鍵節點的數據)- Excel:小型資料庫表/OLAP Cube
- 常用拆解維度:性別/年齡/地區/產品版本/用戶類別、操作系統/手機型號/上游渠道
常常利用Excel(而OLAP Cube是最適合維度分解的產品 )就可以完成,假如,分析地區這一維度,北上廣深四個城市中,上海的用戶月活躍度逐月下降,而其他三個城市不變,那麼就證明問題出現在上海地區。同理,性別、年齡、用戶類別等都是常見的拆解維度。
3、排除數據偏差:數據有問題嗎?- 大數據平台介面:核心關鍵數據來源,可以獲取原始數據
- 常見數據問題:數據流水線代碼bug、產品變動未與數據部門及時溝通
重新調取原始數據、編寫代碼、估算並處理數據得出的結果與數據流水線提供的數據進行比對。如果兩部分數據一致,則繼續向下追蹤;如果數據不一致,確認新生成數據無誤後,需要將數據流水線出錯的情況反饋給數據部門。
4、刨根問底:深挖「問題維度」- 數據倉庫/大數據平台介面
- 常見分析法:長趨勢分析/漏斗分析、用戶分類
在之前的列子里,上海的用戶月活躍度下降,可以把最近9-12個月的用戶月活躍度數據調出,尋找數據下滑的「拐點 」。從數據上很明顯可以看出,拐點所在的那個月一定發生了什麼事情。
5、追根溯源:到底因為為什麼?- 市場訪問/競品分析/團隊討論
- 常見原因:競爭者、上游渠道失敗、新功能不受歡迎
推薦閱讀:
※產品經理到底是幹嘛的?主要是這 3 件事 #008
※互聯網公司 背後的那些暗潮湧動的資本
※從「商業模式畫布」看產品的價值主張和用戶需求
※方案篇(3):滴滴「移動超市」