怎麼評價產品經理拿數據說話這回事?如何做數據分析?

現在PM動不動就拿數據說話,找RD跑數據,有些數據是肯定必要的,有些數據是可要可不要的,比如對於某項目,PM憑經驗可說4級以上的用戶可xxx,這時候會有人跳出來問,為什麼不是3級、5級?拿出數據來。 實際上真看了數據又能看出什麼呢?看完後無非是再次驗證了4級,而且看了數據後主管判斷還是PM來下的。 再比如有的功能是肯定要上的,但領導會說,調研一下有沒有必要,評估數據搞半個月,評估的結果是:可做。 實際上,該功能整個平台的用戶都希望做,是沒有必要耗費人力評估的,只要做就可以了。 很多數據和評估是必要的,但有些很形式化,請問有意義嗎?


數據分析是一種靠譜的產品研究方法, 這玩意有很多誤區, 也不能迷信, 最終到頭來還是要人來做決策

  • 忽略沉默的用戶

二戰時英國空軍為了降低飛機的損失,決定給飛機的機身進行裝甲加固。由於當時條件所限,只能用裝甲加固飛機上的少數部位。他們對執行完轟炸任務返航的飛機進行仔細的觀察、分析、統計。發現大多數的彈孔,都集中在飛機的機翼上;只有少數彈孔位於駕駛艙。從數據上說, 加固機翼的性價比最高. 但實際情況缺恰恰相反, 駕駛艙才是最應加固的地方, 因為駕駛艙被擊中的飛機幾乎都沒飛回來.

"發聲"的數據是最好獲取的, 但如果沒把這些沉默的數據考慮進來, 那麼這種數據分析是不靠譜的. 所以除了數據的結果, 還得嘗試解讀這些數據. 而解讀數據就完全依賴人了.

  • 把沉默用戶當做支持和反對的中間態

2家網站A和B,都經營類似的業務,都有穩定的用戶群。它們都進行了類似的網站界面改版。改版之後,網站A沒有得到用戶的讚揚,反而遭到很多用戶的臭罵;而網站B既沒有用戶誇它,也沒有用戶罵它。如果從數據來看, 應該是網站B的改版相對更成功, 因為沒有用戶表達不滿。但事實並非如此。網站A雖然遭到很多用戶痛罵,但說明還有很多用戶在乎它;對於網站B,用戶對它已經不關心它了.

網站A指的是Facebook,網站B是微軟旗下的Live Space。

  • 把數據作為決策的唯一標準

通常認為數據分析指導工作是一種高性價比的做法, 不容易犯錯, 對於代表資方的管理層來說, 比起依賴於人的決策, 依賴於數據的決策似乎更穩健.

這種決策在從0.5向0.8的產品改進上, 可能是有效的. 因為一個已有的產品, 數據就擺在那. 100個用戶50個訪問超時, 解決了這個問題, 就提升了50%的效果.

但對於從0到0.1的新產品上, 由於數據很難獲取, 需要花大力氣在獲取模擬數據上. 往往是用一周時間去想明白一個做兩個小時的產品該不該做的問題. 而且模擬的結果還和最終實際相差很遠.

A/B test或是原型系統, 先做出來, 再去驗證, 在一些場合下比先拿數據要有效的多.

  • 認為數據是絕對客觀的

為了減少內耗, 往往依賴於數據來做決斷. 我一直認為數據本身是帶有主觀性的, 完全客觀的數據是沒有的. 數據的獲取方法, 數據的解讀方法, 數據的統計方法, 都是人的決策. 一份數據拿出兩個相反的結論來也不是沒有可能. 即使主觀上沒有偏向性, 也受限於方法和視野.

決策上最終起作用的還是人不是數據. 雖然人有那麼多的不確定性, 還可能出現爭論, 扯皮, 不敢承擔責任.

部分內容節選自: 編程隨想--思維的誤區 http://blog.csdn.net/program_think/archive/2010/07/20/5748406.aspx


這幾個月在一家為客戶在Facebook上做廣告的加拿大公司工作。簡單說說他們對於數據的態度吧。這是一家小型Startup公司,總共不到20個人。其中4個人(包括我)是技術,剩下的除了CEO都是Account Manager。當然CEO很多時候也在做Account Manager的事情。

剛到這個公司的時候,覺得他們的code很爛,他們的資料庫設計也很爛。後來才知道,當初startup的時候,是找了印度公司做外包的,他們對這個外包很不滿意,所以一期項目搞定之後,就全部拿過來自己搞了。但是後遺症也留下了。

這個公司的數據模型很清楚,只要通過低於廣告主給出的CPA價格能賺到錢,就想辦法增加廣告覆蓋率。但是常識大家都明白,增加覆蓋率很可能導致轉化率下降。但是如果接受這個假設,那麼就沒有什麼賺錢的機會了。恰恰是因為他們相信,除了常識之外,還有一些事情是經驗之外的。

比如說關鍵詞……有些關鍵詞對某些人有用,對另外一些人沒用。如果不做數據挖掘,生想廣告詞或者關鍵詞的組合,累死了也賺不到什麼錢。

所以……這個公司在代碼中設計了幾個基本核心演算法:

1. 一種止損的trigger,對於任何虧錢的廣告,自動停止。

2. 一個自動發布廣告的cron,程序一直在掃描。一旦發現一些廣告能賺錢,就自由組合這些廣告元素再自動發布到廣告系統裡面。這樣,就能出乎意料的發現一些更加賺錢的廣告形式。

3. 做了很多廣告更新的演算法,搞了一個自動化的A/B測試策略來針對Facebook廣告價格的浮動,來更新廣告的價格。

通過閱讀這些演算法讓我感受很深。所謂的數據分析,不是一個產品經理跑到運維,資料庫管理員或者工程師那裡說:我現在要跟蹤什麼什麼數據,你幫我出一下吧。然後再對著跑出來的數據琢磨這些數據是否合理。

在這個公司里,只要發現一個數據模式對收入有影響,就會直接編碼到系統里,變成自動執行的代碼。基於這樣的數據導向原則,代碼面臨無窮多次的重構,因為誰也不知道,下一個數據模式會發生在哪個層面,哪幾個數據之間會發生關係。

我覺得國內的不少公司,還在以daily report分析數據,還在說數據只是為了驗證產品經理想法的階段。這動作是不是太慢了?

接下來的話,隨便說說,不一定有參考價值:

1. 對於大多數網站,如果你想用數據為導向,必須建立系統級的A/B測試機制。對於界面層面的重構,一個產品經理+一個工程師,一天用這個系統一天至少能做3-4個。系統級別的A/B測試要能夠保證快速上線,第一時間看到數據,一旦超過臨界值直接結束測試、保留數據並生成報告(直接郵件發送,而不是讓產品經理想起來跑到後台再查)

2. 對於做社交網站,或者有複雜用戶數據模型的公司,要在界面呈現和用戶數據之間建立匹配系統。這樣產品經理可以設計幾種呈現模式,丟到匹配系統中,過不了多久,就能發現用戶對不同呈現的數據反映的不同,然後系統性地固化這種機制。

3. 通過cookie或者用戶登錄信息,建立針對不同用戶的內部tag系統,看這些tag在系統2里有沒有明顯差異。如果有就可以固化下來,用來提高關鍵指標。

所以,我現在對於數據分析的感覺是:

1.要提高一個數據指標,盯著它是沒有用的。必須找到影響這個數據的另幾個可操作性更強的數據指標,調整它們。

2.分析數據的可能性要充分,充分分析的基礎是測試充分多的可能性。如果你想測試圖標的顏色從綠色變成紅色會不會更好。那為什麼不測試一下藍色,紫色和黃色呢?

3. 如果小規模數據已經可以說明問題,就沒有必要延長測試時間,也沒有必要擴大測試範圍。

4. 要充分利用計算機來幫你做數據採集和分析,縮短數據分析的周期,降低數據分析的成本。

5. 有必要的時候,可以讓計算機幫你找pattern,因為計算機沒有偏見。


推薦「清華大數據(微信號:Tsinghua_Big_Data)」的一篇文章:

【案例】數據如何指導產品設計

免點擊轉載如下:

標題:【案例】數據如何指導產品設計

兩年之前,那時我剛開始做產品,當需要做數據分析時,我總是一頭霧水,完全不知道該如何下手。我想做好,我真的非常想做好,可我卻真的不知道該怎麼做。經過這兩年大大小小項目的不斷錘鍊,摸索、嘗試、碰壁、復盤、再嘗試,終於能夠根據數據分析的結果,做出成功的產品設計,最終呈現出良好的結果。現在呢,每天到公司第一件事就是看數據,對昨天各平台的流量、各頁面的轉化、各品類各入口各目的地的銷量,心中有數。從數據中發現問題,進行進一步的分析,及時調整優化。

我在網上曾不斷的找有關「數據如何指導產品設計」的文章,一直沒有找到有含金量的東西,所以,我決定自己寫一篇,把自己認為有價值且能迅速用於實戰的東西分享出來:

以「手機淘寶」App為例,打開淘寶App,選擇阿里旅行:

由於我是一直做旅遊產品的緣故,所以還是拿旅遊App做為案例。通過對這個App的觀察,可以把影響數據的因素概括如下:

好了,先說明一下:

1、數據分析的過程:

2、先把因素羅列出來是為了方便大家理解。在實際工作中,遇到一個數據呈現出來的問題,你自然而然就能聯想到由哪些因素造成的,然後去查詢分析相應的數據,找出具體原因。

3、電商類產品普遍以GMV為目標(不要說為什麼不是用戶體驗,電商類和其他類產品在這點真的很不一樣)。

4、大中型公司普遍都有自己的數據平台及相應的數據團隊。每天早上看數據也是產品經理的日常工作。小型公司的話,建議自學SQL,自己在資料庫中查詢數據。其實我在去哪兒網也自學了SQL,因為這樣更方便。先在我們的數據平台上看數據,發現異常,就自己在SQL里查詢更詳細的數據。不用去麻煩數據團隊,因為大家手裡的活都挺多的,自己查的話效率還更高。

5、日常需要分析的數據緯度有:頁面轉化;商戶/商品;用戶緯度;市場環境;渠道推廣;客訴緯度;財務緯度

6、數據分析的利器是Execl,重點要學會用「數據透視圖」,這會對你的工作幫助極大。(以後我會專門寫一個關於數據透視圖的文章)

7、推薦看《誰說菜鳥不會數據分析》,這算是數據分析的入門書了。

案例解析

案例1——產品第一版本上線後,發現首頁向下轉化率極低,才25%。需要緊急提高首頁的轉化率

思考過程:先查詢首頁每一個入口的向下轉化率。發現數據集中在首頁的「搜索」模塊,而其他模塊,比如「熱銷低價商品推薦」,點擊率都極低。基於對我們產品業務的了解來進行分析,我們產品屬於旅遊環節中的中下流。用戶到我們的界面上來時,基本已選好目的地了。那麼他們主要就使用搜索來查詢他們想要的目的地,然後再篩選他們感興趣的旅遊商品。而「熱銷低價產品推薦」由於只命中了單一目的地,且商品不一定是用戶感興趣的,它擊中用戶需求的幾率較低,所以點擊率極低。

解決方案:1)、在首頁增加了更多熱門目的地的入口,並且設計了一個成本極低「運營管理後台」,對目的地進行人工運營配置。2)、把商品分類提到首頁,方便用戶選擇目的地時同時選擇商品類型,進行更精準的搜索,同時讓用戶在首頁了解到我們有哪些類型的商品。3)、刪除了「熱銷低價商品推薦」模塊,增加了「主題游」作為嘗試

後評估:最終首頁向下轉化率提高至68%。措施1提高了約25%的轉化率(每兩周查詢一遍所有目的地的點擊數據,把點擊率低的目的地更換為近期較熱門的目的,反覆替換,最終達到較高的點擊率為止。);措施2提高了約10%的轉化率;措施3提高了約8%的轉化率

案例2——發現某一個渠道帶來的流量的轉化率極高,從進來的流量到下單付款,轉化率能有約10%,而我們一般的轉化率才2%~3%。

思考過程:分析這個渠道的流量質量,發現與其他渠道差別不大,都是對旅遊有需求的普通用戶,且各自的商品類型都差別不大。然後橫向對比所有渠道的流量、轉化率、設計、所在位置、用戶在此處的需求,發現主要原因是這個渠道入口的「設計」與別的渠道不同,這一種設計形式帶來的轉化率要明顯高於其他的設計形式。

解決方案:根據實際情況,把這種設計移植到其他渠道

後評估:此平台(web端)的訂單提高了約15%

案例3——在參與一個獨立App時,發現一個功能的入口點擊率很高(90%),但使用率不高(60%)

思考過程:查詢與之相關的數據,從入口進來的用戶流量都分布在什麼位置,然後發現用戶進來後都集中在新手引導上,反覆的左右翻看新手引導(滑動操作的數據是UV的4倍),且停留時長能有20多秒,發現用戶的注意力都集中到了新手引導上面。

解決方案:在新手引導的最後一頁,增加一個「使用功能」的按鈕

後評估:此功能的使用率從60%提高到了80%

案例4——公司攻略部門願意與我們導流量的合作

思考過程:攻略每天有10萬多UV,若能給我們的商品導流量,一定會促進我們商品的銷售。我們平台(Web端)每天才6000的UV,若能有10萬級的流量入口,對我們商品銷售的幫助一定是極大的。然後考慮到數據越是在下游,就越精準,轉化率也就越高。

解決方案:在搜索結果頁、攻略詳情頁,增加相應目的地的我們商品的入口。推薦每個目的地銷量最好的商品。保證用戶在攻略的界面看到的會是他們需要的商品。

後評估:上線一周後評估,一周僅成一個訂單,遠遠沒有達到預期的一天至少5個訂單。後來經過與攻略產品經理的溝通,分析,發現主要原因是攻略的用戶主要是出行前15天至兩個月的用戶,屬於旅行前期的規劃階段,看攻略是為了選擇去哪裡玩,而去哪兒玩都沒有確定,怎麼會在此時就購買旅遊商品呢?而我們的用戶普遍集中在出行前的三天至七天,是用戶確定了目的地、機票酒店都已經訂好了。才會在我們這裡提前3~7天預訂出境WiFi、包車、導遊翻譯...

最後,數據分析是需要不斷的實踐總結,成功都是靠失敗的經驗教訓堆積而成的。在這個過程中,除了學習產品設計、數據分析的方法以外,更重要的是:了解業務,沉浸到業務當中去,成為自己業務的骨灰用戶,知曉業務的方方面面,產品經理一定要做到比團隊中的任何人都更了解業務!這樣才能夠做出成功的產品設計。

我的初衷是希望你看了之後能夠有所收穫,能夠對你的工作和專業水平的提高,有那怕一點點的幫助。不然我就白寫了 。

來源:簡書;作者:小和;

原文鏈接:數據如何指導產品設計

「清華大數據(微信號:Tsinghua_Big_Data)」 二維碼:

http://weixin.qq.com/r/dDtIUK3E9vCJrekz925m (二維碼自動識別)


對題主懷有的疑惑是這麼理解的:產品經理對數據抽取漫無目的,往往並不能產生價值來知道產品設計。在工作和生活中,為產品經理提供如下的解決方案來提高效率和與程序員之間的和諧度。

一、假設導向(Hypothesis Driven)

之前做戰略諮詢,非常強調假設導向(Hypothesis Driven),這是識別一個好顧問的重要維度。差顧問往往是窮舉法和做無用功(Boil the ocean),搞出一堆堆價值不高的數據和PPT,以一副賣疲勞和曬苦勞的姿勢博取客戶的同情,然而整個團隊卻被自己搞得疲憊不堪,客戶傲嬌得也不買單。

換到產品經理這個職位上,道理相通。產品經理很容易為了數據而數據,亦或是為了應對老闆的需求,各種埋點各種需求,大量且高頻度得要求程序員配合提取及處理數據,然而數據是否有卵用,並沒人知道。所以,像題主這樣的程序員有如此困惑,並不奇怪。好的產品經理在數據分析上不應該盲目,在產品發布之前就應該思考清楚需要驗證的假設,功能或者交互或者變現,比如:左右劃的新交互方式,是否增加了人均PV卻增加了用戶誤操作帶來的體驗下降;新功能是否提升了留存率等等。然後設計數據的收集方式以及證明或證偽的方法。類似於高手下棋,總是要多想幾步。

而最差的方式就是盲目打擾程序員而不斷抽取數據,發現數據並沒有卵用,又提取更多的數據,最終形成人仰馬翻而產品並無進展的惡性循環。

二、提高數據處理能力

編程的產品經理非常少見,哪怕是用SQL。於是就大大限制了產品經理的數據處理和分析能力,和提高了其與程序員的耦合度,即使有了原始數據,產品經理還是需要程序員去清理數據和預分析數據。在做投行、行研、諮詢等金融崗位,有沒有什麼好用的找數據技巧呢? - 何明科的回答和Excel 到底有多厲害? - 何明科的回答兩個回答中,很好地詮釋了有一定編程能力的產品經理,可以如何提高效率和提高數據處理能力。因此建議產品經理學會基礎的SQL、Python、VBA及高階的Excel技能,盡量實現小閉環,有活兒自己干,有數據自己分析。

當然程序員也不是只能坐以待斃。在數據分析中,從日誌到乾淨的數據,從海量數據到產品經理能分析的數據,往往需要程序員深度接入開發和整理。這往往是程序員最不願意介入的活兒,而產品經理又無能為力。於是最終的結果,就是一堆堆的日誌文件堆在那裡無人搭理。幸好後來出現了Splunk等工具,不僅能夠輕易得利用其強大的資料庫引擎將紛繁蕪雜的日誌文件進行索引和存儲以及數據提取,為程序員省去不少功夫。

而且還提供簡單的類似於JSON的查詢語句,實現基本實時的數據收集和分析,讓產品經理可以直接操作和分析日誌文件,對功能和用戶行為直接進行分析。

三、善用系統

非常同意@丁士正 所舉出的例子,真正的數據分析是融入在系統中的,即系統性得使用AB Testing,在產品上線之前就設計和開發好數據監測、評估及反饋的機制,根據上線後的實際情況,進行實時的分析、調整和優化。我與小夥伴們就曾經用Splunk開發過類似的系統,大致步驟如下:

  • 同時發布n個版本,或者版本上含有A/B頁面
  • 上線後根據Splunk返回實時的數據及分析結果
  • 根據數據及分析結果,選擇最優的版本或者頁面作為正式版固定並上線

整個過程看不到數據分析或者提取數據,然而處處是數據,數據分析及以分析結果作為指導來改善產品,已經完全融入到產品之中。

————————————————————

更多文章關注我的專欄:數據冰山 - 知乎專欄


以下是一個數據驅動的例子,例子簡單,啟發挺大

近期,http://OkCupid.com(一個交友網站)做了一個測試,把首頁的最近來訪列表移除了,只留了一個不顯眼的入口。注意:最近來放列表對99%的交友網站都是必備!!!

有人在Quora上問為什麼會做這個測試,他們的產品Tom Jacques這麼回答:

1,OkCupid很依賴數據,這些都是做A/Btest的結果

2,數據顯示,如果在首頁放置最近來訪,這個功能會和背景融為一體,用戶會更少的點擊,而且進入個人資料後,發消息也少了。反而,將入口藏起來,用戶會更嚴肅的對待這個功能,點擊率和消息率都增加了。

我又追問了2個問題,這哥們的答案能看出他們做事的方式:

Q:怎麼證明這不是一個短期效應,比如用戶對改變敏感,時間長了這個行為又變回去了。

A:測試會持續足夠長的時間。同時,對新用戶進行測試,這部分用戶沒見過之前的形式。這兩個措施保證了可以提高測試的可信度。

Q:最近來訪看起來是個常規功能,而且看上去很不錯,怎麼想到對這個功能進行A/B test。

A:我們的原則是懷疑一切,有些功能看起來不錯,但是不是說他不能做的更好。所以,我們經常性的對一些功能進行測試,確保他們是不是真的最好。

最後介紹下OkCupid這個交友網站,創始人是哈佛幾個學數學的人,通過各種測試幫你找到合適的人。

附Quora問題地址

http://www.quora.com/OkCupid/Why-were-vistors-removed-from-OKCupids-user-landing-page/answer/Tom-Jacques?__ac__=1#comment1098884


數據是一種信仰

毀掉分析數據態度的三個常見原因

首先,大環境不尊重數據,尤其是老闆的態度。如果數據分析師只要隨便給一個報告就行,數字多一點和少一點,大家也是一笑而過,並不會追根到底,那麼很難讓數據分析師以嚴謹的態度對待數據。

例如,國內這幾家數據分析機構,基本都在著急擴張行業,爭著佔領行業,對於其推出的數據有多精準卻不那麼在意,所以艾瑞的數據最近才會經常被人說「不靠譜」。

數據分析,今天做得不準,明天再改是沒有用的。比如艾瑞,如果數據不穩固,搶著做很多行業,這是不靠譜的做法,指不定哪天砸了自己的牌子。

有人和我提過FACEBOOK數據分析師為什麼那麼牛,因為他們不覺得數據分析是一個苦事,十幾個人在一個房子里把數據分析當做一件很開心的事情來做,數據分析對於他們來說是在追求科學。

第二,好的數據分析師需要一點天分,同時也需要高人點撥,但是電子商務這個圈子,真正懂數據分析的人不會超過10個,所以一般人很難取得真經。這和信仰一樣,沒有師傅領進門,難度也會大很多。

我回顧自己從微軟到易趣,再從敦煌到支付寶,在數據分析上有一次長足的進步,得益於從兩位老師的身上得到了許多啟發。一位是亞馬遜的首席科學家韋思康,曾經,我告訴韋思康,KPI報告顯示敦煌網需要4秒鐘,他立馬讓我叫來做技術的同事(他要聽到一線同學的反應),問這個4秒鐘怎麼測算出來,是美國人打開用4秒鐘,還是英國人打開用4秒鐘,用的是甚麼Browser等等。這個4秒鐘和商業價值(例如交易量)有關係嗎?我當時很觸動,連這麼一個很基礎的數據,他都是以求證的心態來分析的。更令我印象深刻的是,只請他當敦煌網顧問半天,按照他的工作經歷來說,隨便忽悠我半天是很容易的事情,但是韋思康非常嚴謹,先是以一個普通人的身份花了半個小時在敦煌網買東西(堅決要真實付錢),切身體會敦煌網的用戶體驗,然後也不先看數據,而是先問很多能更了解敦煌網的生意形態的問題。講真他的問題比很多投資分析師來得專業。而現在許多數據分析師,包括當時我自己,只看數據就開口說問題,不深入去體會公司的商業形態。

韋思康告訴我數據是一種態度,讓我明白做數據的人就是要全身心投入,好像一種信仰一樣,中間有許多路要走;而且,數據與商業密切相關,不能局限在數據的死角里。

另一位是清華大學的教授謝勁紅,有一個夏天碰巧去旁聽他的課,拿一堆的數據給他看,他一邊看一邊給我演繹他的思維,他可以很快在一堆數據找到他們之間的關係。後來我帶著團隊常常去清華找他聊,他教我如何看網路數據,用聯動的思維來看網路數據。可以說是他啟蒙了我用 「關係」的思維看數據。一聽完就回到敦煌跑到敦煌看很多數據,發現了新世界。

第三,數據分析師感嘆落不了地,只能談數據,而不懂商業。如果不懂商業,而單純看數據,不僅很難有創意的思維,而且是沒有意義的(曾經談過這個問題,不懂商業就別談數據:http://blog.sina.com.cn/s/blog_5025e3880100kwn1.html)。

而對於一般的數據分析師來說,大部分人沒有系統思維,而且也只能看一部分數據,無法從大面兒上了解整個公司的運營數據,這樣就令數據分析師難以形成全面的思考方式。

以我自己的工作經歷來舉例,為什麼我在敦煌的時候數據分析能力會突飛猛進,也是因為我在前兩家公司只能看到一部分數據,而到了敦煌之後我愛看什麼就看什麼,受謝教授啟發之後我更是天馬行空地把營銷數據、市場數據、財務數據、產品數據、賣家和買家數據等等聯動起來看,這大大改變了我對數據的運用方式。

http://blog.sina.com.cn/s/blog_5025e3880100qjbf.html


關於這個問題,我對題主有兩個地方存在疑問,所以接下來也從這兩個方面去回應題主。

第一,題主說,「實際上,該功能整個平台的用戶都希望做,是沒有必要耗費人力評估的,只要做就可以了。」

但是現實中,用戶希望做的功能難道真的不需要評估嗎?用戶提出的要求都滿足嗎?

第二,題主說,「很多數據和評估是必要的,但有些很形式化,請問有意義嗎?」

那麼數據分析到底該怎麼做,才不至於淪為 「形式化」 ?

一、從一次改版談產品數據分析

2015 年末的時候,我們 GrowingIO 的產品已經上線了 1.0 版本並且服務了多家客戶。隨著新用戶的不斷增加,產品經理每天都能接到了好多新用戶反饋:希望在官網看到產品介紹視頻,以便進一步了解我們產品的功能和特點。

既然每天都有用戶在提這個事情,那肯定是很重要的東西了。正如上面知乎網友說的:「 實際上,該功能整個平台的用戶都希望做,是沒有必要耗費人力評估的,只要做就可以了。」 於是不假思索,在產品經理和市場同學的努力下我們很快把介紹視頻做好了,放在官網首頁上。

添加了新的介紹視頻後,產品運營想觀察一下其對新用戶的註冊轉化率影響如何。持續觀察了一個星期的數據,發現新用戶的註冊按鈕 CTR(Click Throught Rate,點擊率)不但沒有上升,反而斷崖式下降,由原來的40%左右跌倒了20%。

對於一家高速成長中的創業公司, 轉化率大幅度下降當然是不能容忍的;但是為了保險起見,我們又持續觀察了一周的時間。兩個星期後仍未起色,於是產品經理撤掉了官網上的介紹視頻。奇蹟般一樣,CTR 開始恢復到改版前的水平。

這個產品介紹視頻花了產品和市場部門大量的人力、精力和物力,又是因為用戶的需求而專門做的,為什麼做了之後轉化效果反而下降了呢?

事後我們反思了整個過程,得到這樣一些啟發:

(1)部分用戶的觀點無法代表全體用戶的真實體驗,產品介紹視頻可能是偽需求;

(2)產品經理的主觀感知無法代表用戶的真實體驗;

(3)新加的視頻介紹分散了新用戶的精力,導致首頁註冊點擊率大幅度下降。

還好我們當時用自己產品對我們官網做了實時的監測、對比了改版前後的註冊 CTR 指標,不然現在還在官網改版的坑裡面自嗨呢!所以,改版前後的數據監測和數據驗證是非常重要的。

二、產品經理需要用數據說話

相信上面 GrowingIO 的案例已經能給你一個直觀的感受了。 完全拍腦袋、憑感覺、憑經驗做決策的時代已經過去了,產品經理必須掌握數據分析技能、用數據說話!

(一)通過數據分析迭代產品

在用戶研究的過程中,很多產品都會把自己換位成用戶來思考。出發點是好的,但是也很容易陷入誤區中;因為任何模擬都是蹩腳的,思維定勢決定了產品經理無法靠想像來 100% 還原用戶的真實操作行為。

給大家舉一個經典的案例:圖片社交軟體 Instagram。Instagram 的前身, Burbn(上圖左) ,是一款基於地理位置簽到的積分軟體,這款產品做了好久一直都不溫不火。直到有一天他們通過數據分析發現,Burbn 的用戶對產品主推的簽到功能並沒有展現出什麼興趣,反而喜歡用系統嵌入的圖片分享功能。於是產品邏輯開始重構,主推圖片社交分享,這才有了現在的 Instagram(上圖右)。

用戶就是這麼奇怪,從不按套路出牌;你需要不斷通過數據來觀察他們的興趣點,而不是坐在辦公室模擬或者假設。

(二)通過數據分析洞察用戶

產品的每一次迭代和升級,都需要評估效果,以便今後改進。如果僅僅是憑藉產品經理的肉眼觀察和主觀感受,下一個「用戶反饋很好」、「用戶很喜歡這個新功能」類似的結論,是很蒼白無力的。更多時候,會因為主觀感覺而產生誤判。

我們之前遇到過一個客戶,有一段時間網站的註冊轉化率有了上升;雖然並沒有查出原因在哪,但是產品經理還是很高興。過了一段時間,分析師通過用戶行為軌跡細查發現,【找回密碼】功能出 BUG 了;很多老用戶忘記密碼無法找回,只好重新註冊了一個賬號。

這個 BUG 無意中提升了網站的註冊轉化率,然而卻並不是件好事;如果產品經理不做數據分析的話,就會產生錯覺,陷入「轉化率提升」的坑中!

(三)通過數據分析驗證產品

如何驗證一個新功能好還是不好,這個需要數據來說話。除了產品本身的指標,產品經理還要關注產品或者企業的商業目標,畢竟產品最終還是為這個負責的。上面我們分享了 GrowingIO 首頁改版的案例,雖然滿足了部分用戶的需求,但是造成了註冊轉化率的大幅度下降。下面這個案例來自 Facebook, Facebook 早期員工、峰瑞資本合伙人覃超曾在我們的線下活動分享過,希望能給大家帶來啟發。

下圖左邊是2009年的 Facebook 首頁界面,當時的產品經理想嘗試瀑布流式、扁平化的設計風格,提升用戶的操作體驗。在設計了好幾個版本後,決定採用了右邊的設計。工程團隊用了好幾個月做了出來,內部測試後大家都覺得很好,沒有太大問題。於是,新版首頁開始面向 2% 的用戶灰度發布,看一下效果。

結果出問題了,這2%的平均在線時長指標開始下跌,直接影響到了這部分用戶的廣告曝光。大家都知道廣告是 Facebook 重要的業務收入來源,廣告的曝光和點擊下降當然是不能接受的。

項目組的同學認為可能是用戶對於新版本需要適應的時間,決定再開通10%的用戶,觀察整體的效果。結果,整體活躍度、在線時長跌了20%左右,一直持續了3個月。最後,Facebook 沒有通過這個改版,首頁回滾到最初的樣子。那麼大的一個團隊,做了大半年的項目,因為數據驗證沒有通過直接作廢。Facebook 這麼大的企業都在貫徹著數據驅動的思路,我們又何嘗不應該呢?

三、產品數據分析如何避免踩坑

對於產品經理來說數據分析很重要,但是又該怎麼做呢?數據分析如何避免淪為形式,又該如何避免踩坑呢?

(一)發聲用戶 VS 沉默用戶

文章一開始 GrowingIO 的案例就是一個很好的說明,發聲用戶提出需求要我們提供產品視頻,但是沉默用戶可能直接就流失了。其實分析的時候本質並不在於用戶發聲還是沒發聲,本質在於真正目標用戶的感受。

發聲用戶的數據非常容易獲取,數據分析也就更加容易;沉默用戶很多都流失了,用戶選擇用腳投票,這部分的數據獲取和數據分析就更加困難。產品經理如果在做數據分析的時候只採用發生用戶的數據,分析的結論往往有偏差,統計學上有專門研究抽樣問題,說的就是這麼一回事。

(二)先入為主 VS 保持客觀

大部分時候,人們總是更喜歡看到自己想看到結果,即先入為主或者預設結果。產品經理在做數據分析的時候,也容易出現這樣的預判,數據分析往往變成為為自己的觀點找論據。

比如新功能上線,管理層希望用戶活躍度可以提升5%;那麼此時產品經理在做復盤的時候就會過分關注眼下的 5%,而忽略可能 50% 的增長機會甚至無視其他負面的影響。

(三)報告驅動 VS 業務驅動

產品經理數據分析的最終目標還是指導產品和用戶增長,幫助企業增加利潤。產品新人在做數據分析的時候容易將數據分析的終點歸結於數據報告,以為寫完一份產品數據分析報告就等於做完了一次數據分析。

數據分析驅動產品和用戶增長不是一鎚子買賣,而是一個不斷迭代的過程。產品經理應該在 「用戶數據-數據分析-產品優化」 的循環中不斷鍛煉自己的數據分析能力,將目光聚焦於產品優化用戶增長。

越來越多的企業在招聘產品經理時,會在崗位描述上寫「掌握數據分析方法」、「擅長產品用戶行為數據分析」等字眼,產品經理要會數據分析已經是大勢所趨。我們不能因為有的人將數據分析形式化就否定數據分析的意義,只有正視數據分析、避開誤區,數據分析才可能發揮它的最大價值。

這篇文章也收錄在 GrowingIO 2017年第 3 期電子書《產品經理數據分析手冊 | 能力升級必備》。

歡迎各位下載閱讀。

這本書面向產品經理,從建立數據分析的能力體系,到相關的書籍、方法、工具推薦,再到數據產品經理崗位介紹、日常工作的轉化分析和迭代案例。為產品經理們提供了數據分析技能提升的整體框架和思路,相當全面。

同時也歡迎各位註冊試用 GrowingIO-矽谷新一代無埋點用戶行為數據分析產品,最近還上了漏斗新功能,非常好用。


對數據的使用程度,取決於你的產品所處的階段。

當你的產品當前處於初級階段時,你的產品其實是「一切皆有可能」套用一些數據分析方法,反而束縛了產品可能發揮的空間。這個階段更依賴初期做這個產品的衝動和對用戶需求的感性把握。

當你的產品當前處於用戶基數很大且成熟期時,你的產品已經確確實實滿足了用戶的某種需求,這個需求的滿足是立足點,不能輕易動搖,而且需要進一步完善和改進,這個時候數據的分析很重要,也更加客觀。

關於數據分析和用戶反饋,一篇社交遊戲設計的文章中提到的觀點很有借鑒意義,以下為引用請參考:

很多人社交遊戲公司是依賴數據分析來判斷用戶喜好並不斷進行修正,但事實上類似Zynga這種擁有超級用戶數據分析能力的公司並不多見,大部分公司根據用戶行為調整遊戲方案一直停留在純理論階段,我見過部分公司對市場反饋不理想的遊戲直接做法是回爐重新打造。對於缺乏資本和資源支持的公司,最好的做法是預判用戶需求而不是試圖實現用戶的想法。

數據分析是一個很傳神的說法,但是這個更多隻限於細節方面的調整,就連Zynga在製作Cityville的時候也有類似的困擾,他們剛開始並不清楚Cityville會不會只是Farmville的簡單翻版,甚至還打算讓Challenge Games來接手這個項目,但最後在團隊的磨合下才形成現在的遊戲樣式和超級影響力。Cityville的最終成型和用戶的反饋關聯不大,最核心的部分還是在於開發者層面的自我調整。

It Girl設計師Brice Morrison認為數據分析是根據用戶反饋來反推遊戲設置合理性,比如每個等級的玩家數量、體驗時間和消費金額。還有另外一個重要層面是玩家的遊戲進程中所處的量級並不一樣,開發者利用了玩家的時間差,以少部分領先者為體驗對象,再根據他們的反饋修正並服務於後面絕大部分的玩家。Brian Reynolds提到過他們是如何在FrontierVille中從馬蹄鐵的提供數量來判別玩家對一些微調的反應。


首先數據作為一種重要的評估手段被拿來說事是經過很多年驗證的,但數據本身是死的,需要我們去分析,如今數據是越來越多了,但是分析的結果卻越來越低了,顯然這是人的因素,一個pm能夠拿著數據讓rd幹活必須做到幾點:

1. 對數據有客觀的分析過程,最終產出的不應該只是一個結論,還應該包括你的分析方法和分析過程,這些也要講給RD,只有這樣數據才真正起到了應有的作用!

從這個角度講為什麼使用4星,而不是3星或者5星,也應該是給出理由的,而且必要時也需要數據證明。

2. 不要對數據想當然,很多pm拿到數據根本沒做深層次的分析就直接告訴RD你看這個數據說明什麼的,甚至其他網站的運營數據,很多PM會直接拿來講給RD,這個情況我相信即使資格深一點的PM也有的。

我要說的是不要把其他人的數據想當然成我們自己,一個產品能夠成功是有個過程的,這就是我經常說的成長期,我們雖然沒辦法參與每個過程,但是在使用別人數據的時候還是需要分析這個過程的,數據不能脫離年代、環境、用戶、等等很多客觀因素單獨存在!

3. 不要過於依賴數據,數據只是我們產品發展中輔助的東西,PM應該更多的了解很多數據之外的事情,如社會環境、用戶水平、競品狀態,這些東西新人更應該注意,不要總拿個數據跟RD轉牛腳尖!

其次,作為RD我覺得我們一定要在工作過程中變得更加主動!

1. 如果對PM的分析結果或者分析過程不滿意,要隨時提出,不要太被動,太被動你就慢慢成了被影響的人了,對自己前途,產品前途都不利!

2. 主動去跟PM溝通協調,其實大家目標是一致的,既然這樣,我們都是追求最大的效率,你要把你的實際情況反應給PM,讓大家都能去權衡得實!

最後,我個人覺得RD別總太轉進技術中,也要學習新的東西,包括產品設計,項目管理,敏捷開發,很多看似不相關的東西往往是相關的,對自己影響很大的!

你提到 「實際上,該功能整個平台的用戶都希望做,是沒有必要耗費人力評估的,只要做就可以了」

其實你自己的想法是存在問題的,第一,你怎麼了解用戶的想法的?第二,該功能到底是基礎功能還是點綴的功能?第三,眼下什麼是最重要的?

我相信評估也許是必要的!


「PM憑經驗可說4級以上的用戶可xxx,這時候會有人跳出來問,為什麼不是3級、5級?拿出數據來。 實際上真看了數據又能看出什麼呢?看完後無非是再次驗證了4級,而且看了數據後主管判斷還是PM來下的」

用數據驗證自己的想法是必要的,但是不可能每次都是通過驗證,一定有數據顯示推翻PM設想的情況。倘若每次都是驗證PM的設想,基本上可以肯定PM是帶著主觀意向去看數據的,他從數據中找出支持自己論點的部分,然後來說,你看如何如何。。。數據是不會撒謊的,關鍵看你如何解讀!我想這種情況下,rd需要更積極主動,要求PM說明他的分析邏輯,從中提出質疑。

「調研一下有沒有必要,評估數據搞半個月,評估的結果是:嗯,可做。 實際上,該功能整個平台的用戶都希望做,是沒有必要耗費人力評估的,只要做就可以了。」

一半一半。如果評估的結果是不可做,即使評估數據搞了1個月、甚至2個月,也是值得的。如果用戶。PM都認為應該做,也建議先進行一個數據分析,可以是粗糙的,但卻是必須的。一件事情做不做可能是可以憑經驗決定的,但是具體如何做,卻需要數據的支持。

數據分析絕對是必要的,不過如何解析數據卻是一門大學問,每個指標是如何產生的,指標代表的意義是什麼,核心指標是什麼等等。

喜歡上面回答中的一句話,數據分析是科學~


本人常年從事市場產品工作,對數據統計自學過一陣為碩士論文用。

就我自己體會講幾點:

1、有意義的數據極其有必要,這裡的有意義指a.精度有意義,精度太高很不必要代價太大精度低了那和沒有數據也是一樣。b 指向有意義,這個就需要豐富的經驗來把握,哪裡去獲得數據?和誰去比較?能說明什麼?這一系列問題能把握住才能稱為數據指向有意義。

2、不贊成先有結論再去用數據求證。提出這中說法的人基本上都是用來湊數據的。稍微了解統計思想的就知道,統計的證明是建立在拒絕基礎上的,而不是承認假設。不知道有多少人想過沒有這是為什麼?不展開了。

3、PM的黃埔軍校是快消行業(鄙人是搞通訊的,水平差很多),快消行業不用數據說話那簡直。。。這裡肯定有人說我是搞IT的通訊的B2B的,和快消差很多,我們行業關注的是決策鏈等等。我要說這都是扯淡,舉個例子微軟現在的CEO原來就是在寶潔干PM的,所以洗髮水和軟體本質沒啥區別

4、在中國的傳統里理數被認為是奇技淫巧之類因此是欠缺的,所以中國人的嚴謹性群體缺失我敢說堅持數據無用論中90%以上是懶得去搞數據,或者看見的垃圾數據太多已經失去對數據的信賴,但我相信一旦一份邏輯嚴密數據嚴謹的數據放在你面前你一定無法忽視。

5、人的辨別能力是有限的,很多數據工作是為了研展你的辯識能力,比如數據挖掘。一堆雜亂的數據對你是毫無用處的,但通過處理就可能告訴你很多你忽略的信息。因此數據挖掘我認為是PM必須具備的職業技能。

補充6、最近看到了一篇講數據統計方法的文章全文如下,很糾結轉不轉有點長,但想想來知乎的應該都不怕長的,就轉了吧。如果你能搞明白「因果網路」這個關鍵點那麼數據分析就有極有意義的,如果你搞岔了那麼數據分析會誤入歧途。當然任何項目的展開都受制於資源,但這個思維方式在數據分析前必須具備的,全文如下:

--------------------------------------------------------------------

http://www.matrix67.com/blog/archives/930 (原文地址)

zhihu網上曾經有過一個問題,談如何看待用數據說話來分析問題,看了很多很多回答,自己也嘗試回答了這個問題,看見這篇文章才知道真正的問題所在就是「因果網路」

-------------------------------------------------------

在去年10月份的數學文化節期間,我去聽了好幾次講座,其中有一些講的相當精彩。時間過得好快,轉眼間又是一年了,如果不是Wind牛發簡訊問我去不去聽講座,我估計今年數學文化節過了都還想不起這檔子事。於是和Wind牛跑去二教309,聽了一場叫做《從數據中挖掘因果關係》的講座。這個題目是很有趣的:數據本身並不說謊,難就難在我們如何從中挖掘出正確的信息。當我們討論數據時,我們講的最多的是數據的相關性,而我們希望得到的則是事件之間的因果聯繫;但事實往往是複雜的,統計數據有相關性並不意味著兩個事件具有因果聯繫,而具有因果聯繫的兩件事從統計數據上看有時也並不相關。

對於前者,最簡單的例子就是公雞打鳴與太陽升起:公雞打鳴與太陽升起總是同時發生,但這並不表示把全世界所有的公雞都殺光了後太陽就升不起來了。統計發現,手指頭越黃的人,得肺癌的比例越大。但事實上,手指的顏色和得肺癌的幾率之間顯然沒有直接的因果聯繫。那麼為什麼統計數據會顯示出相關性呢?這是因為手指黃和肺癌都是由吸煙造成的,由此造成了這兩者之間產生了虛假的相關性。我們還可以質疑:根據同樣的道理,我們又如何能從統計數據中得出吸煙會致癌的結論呢?要想知道吸煙與癌症之間究竟是否有因果聯繫的話,方法很簡單:找一群人隨機分成兩組,規定一組抽煙一組不抽煙,過它十幾年再把這一撥人找回來,數一數看是不是抽煙的那一組人患肺癌的更多一些。這個實驗方法本身是無可挑剔的,但它太不道德了,因此我們只能考慮用自然觀察法:選擇一些本來都不吸煙的健康人進行跟蹤觀察,然後呢,過段時間這一撥人里總會出現一些失意了墮落了犯上煙癮的人,於是隨著時間的流逝這幫人自然而然地分成了可供統計觀察的兩組人。注意,這裡「是否吸煙」這一變數並不是隨機化得來的,它並沒有經過人為的干預,而是自然區分出來的。這是一個致命的缺陷!統計結果表明,犯上煙癮的那些人得肺癌的幾率遠遠高於其他人。這真的能夠說明吸煙致癌嗎?仔細想想你會發現這當然不能!原因恰似黃手指與肺癌一例:完全有可能是某個第三方變數同時對「愛吸煙」和「患肺癌」產生影響。1957年,Fisher提出了兩個備選理論:癌症引起吸煙(煙癮是癌症早期的一個癥狀),或者存在某種基因能夠同時引起癌症和煙癮。

有虛假的相關性數據,就有虛假的獨立性數據。「健康工人效應」是一個特別有意思的理論。調查發現,在鈾礦工作的工人居然與其它人的壽命一樣長(有時甚至更長)。這表明在鈾礦工作對身體無害么?當然不是!其實,是因為去鈾礦工作的工人都是經過精心挑選的身強體壯的人,他們的壽命本來就該長一些,正是因為去了鈾礦工作才把他們的壽命拉低到了平均水平。這一有趣的細節導致了數據的偽獨立性。類似地,有數據表明打太極拳的人和不打太極拳的人平均壽命相同。事實上呢,太極拳確實可以強身健體、延長壽命,但打太極拳的人往往是體弱多病的人,這一事實也給統計數據帶來了虛假的獨立性。

現實中的統計數據往往會表現出一些更加詭異複雜的反常現象。Simpson悖論是統計學中最有名的悖論:各個局部表現都很好,合起來一看反而更差。統計學在藥物實驗中的應用相當廣泛,每次推出一種新葯,我們都需要非常謹慎地進行臨床測試。但有時候,藥物實驗的結果會讓人匪夷所思。假設現在我們有一種可以代替安慰劑的新葯。統計數據表明,這種新葯的效果並不比安慰劑好:

有效 無效 總人數

新葯 80 120 200

安慰劑 100 100 200

簡單算算就能看出,新葯只對40%的人有效,而安慰劑則對50%的人有效。新葯按理說應該更好啊,那問題出在哪裡呢?是否是因為這種新葯對某一類人有副作用?於是研究人員把性別因素考慮進來,將男女分開來統計:

男性有效 男性無效 女性有效 女性無效

新葯 35 15 45 105

安慰劑 90 60 10 40

大家不妨實際計算一下:對於男性來說,新葯對高達70%的人都有效,而安慰劑則只對60%的人有效;對於女性來說,新葯對30%的人都有效,而安慰劑則只對20%的人有效。滑稽的一幕出現了:我們驚奇地發現,新葯對男性更加有效,對女性也更加有效,但對整個人類則無效!

這種怪異的事屢見不鮮。前幾個月一個高中的師弟給我發簡訊,給了我兩個大學的名字,問該填報哪個好。鑒於我目前的悲慘境遇,我非常認真地幫他查了一下兩所大學的男女比例,並且很細緻地將表格精確到了各個院系。然後呢,怪事出現了:A學校的每個院系的女生比例都比B學校的同院系要高,但合起來一看就比B學校的低。當然,進錯了大學找不到MM是小事,大不了像我一樣20歲了連初吻都還沒有,拿出去丟丟人讓別人笑話笑話就完事了;但醫藥研究需要的是極其精細的統計實驗,稍微出點差錯的話害死的可就不是一兩個人了。上面的例子再次告訴我們,統計實驗的「隨機干預」有多麼重要。從上面的數據里我們直接看到,這個實驗的操作本身就有問題:新葯幾乎全是女的在用,男的則大都在用安慰劑。被試者的分組根本沒有實現完全的隨機化,這才導致了如此混亂的統計結果;不難設想,如果每種藥物的使用者都是男女各佔一半,上述的悖論也就不會產生了。當然,研究人員也不都是傻子,這麼重大的失誤一般還是不會發生的。問題很可能出在一些沒人注意到的小細節上。比如說,實驗的時候用粉色的瓶子裝新葯,用藍色的瓶子裝安慰劑,然後讓被試人從中隨機選一個來用。結果呢,MM喜歡粉色,選的都是新葯;男的呢則大多選擇了藍瓶子,用的都是安慰劑。最後,新葯和安慰劑都發完了,因此直到結果出來之前沒有人會注意到這個微小的性別差異所帶來的統計失誤。

當然,上面這個藥物實驗的例子並不是真實的,一看就知道那個數據是湊出來方便大家計算的。不過,永遠不要以為這種戲劇性的事件不會發生。一本叫做《致命的藥物》的書詳細披露了20世紀美國的一次重大藥害事件,其原因可以歸結到藥物實驗上去。藥物實驗的時間是有限的,如果用死亡率作為唯一標準的話,估計每個藥物實驗都得觀察個十幾二十年才行。為此,科學家們想到了利用各種「中間變數」來替代死亡率這一指標。

統計數據表明,抑制心律失常能夠減少死亡率,而當時的藥物實驗明確表明該藥物能有效地抑制心律失常。這些藥物得到了FDA批准並成功上市,當時每年有20多萬人服用這些藥品,超過5萬人因為服用這種藥物而死亡。這個藥物實驗中蘊含的邏輯推理看似無懈可擊,到底什麼地方出錯了呢?人們推測很可能是某個第三方變數的問題。我們不妨稱這種情況為「中間變數悖論」。

抑制心律失常 死亡率

對照組 實驗組 未抑制 抑制

無缺陷(70%) 0.02 0.99 0.02 0.01

有缺陷(30%) 0.98 0.79 1.00 0.02

---------------------------------------------------

期望值 0.38 0.93 0.314 0.013

讓我們假設存在一個第三方因素,例如基因問題。我們不妨暫時管它叫做「先天缺陷」。從上表中我們可以看到,實驗組(使用新葯的人)中有93%的人成功抑制了心律失常,遠遠高於什麼都不做的人(38%);同時,心律失常確實會導致31.4%的人心臟驟停而死,但抑制心律失常則把這個比率下降到1.3%。這似乎確實可以說明,新葯能夠有效降低死亡率。但引入第三方因素後,情況有了很大的改變。有先天缺陷的人,心律往往很正常,恐怖的是一旦無法抑制心律失常則必死無疑。真正要命的就是,這種藥物會使那些有先天缺陷的人心律變得更差。在沒有缺陷的那70%的人當中,用藥後有99%的人能抑制心律失常,而這裡面只有1%的人會死;同時,另外1%的人則無法抑制,其中又有2%的人會死亡;有先天缺陷的那30%的人就慘了,用藥後抑制住心律失常的人反而下降到79%,其中有2%的人會死,而對於另外21%的人則必死無疑。計算表明,使用藥物後死亡的人數竟然三倍於不使用藥物時的情況!

(0.7*0.99*0.01 + 0.7*0.01*0.02 + 0.3*0.79*0.02 + 0.3*0.21*1.00)

/ (0.7*0.02*0.01 + 0.7*0.98*0.02 + 0.3*0.98*0.02 + 0.3*0.02*1.00)

≈ 2.91

可以看到,從數據中挖掘因果關係並不是那麼簡單的事。如何確定影響目標的事件,如何從數據中獲取相關關係,怎樣用最少的實驗次數(控制最少的變數)為因果關係定向,這都是建立一個因果網路所需要考慮的因素。因果網路是一個很複雜的學問,前天的講座里還提到了很多確定因果網路的演算法,在這裡我就不再多說了。

--------------------------------------------------------

http://www.douban.com/note/168633020/ (鄙人博客地址)


之前貌似看到過一個「產品經理如何使用數據」的提問,找不到了。感覺差不多,就在這裡回答了。

繼競品分析之後,「數據分析能力」也是產品經理的重要基本功之一。

先回答題主困惑,數據分析必是有理有據的邏輯過程,通用數據指標甚至都是業內統一定義如DAU,留存。個性化指標確定必須是公司相關人員都同意且認可的統計方式。所以題主舉的產品經理使用數據情況屬於錯誤使用(錯誤點:1個性化指標沒有被認可;2分析過程存在漏洞),不是真是數據分析方法。因此根據個人經驗,總結下產品經理使用數據的姿勢如下:

寫在開篇的聲明:

1)這裡寫的是產品經理(不是數據建模工程師)工作中所需的數據分析能力。因此並不涉及複雜的數理統計和數據挖掘知識。

2)用戶畫像和市場數據也是數據的一部分,但個人習慣將其歸為用戶和市場研究部分。後續用戶和市場分析會詳細展開。

3)很難追求數據的絕對準確,而要追求數據的相對準確。所以如果感覺數據有問題,不要在沒有論證的情況下衝到工程師面前質疑一番,一是沒有確定問題存在的時候很難查證,二是會讓工程師反感。

產品數據的作用:

主要作用就是監控產品設計、運營效果、營收是否正常或達標。並判斷業務發展階段,為後續推進提供參考。

數據能力的核心:

數據的核心主要就是數據打點,數據使用,數據預估。

________________________

1)數據打點:

數據打點,也叫埋點。其原理就像在路上安放監控探頭,一旦有符合記錄條件的車通過,探頭就會按照設定上報相關信息。

步驟一:

在打點前先弄清楚是客戶端打點還是前端打點。

客戶端打點要儘可能全面並具有擴展性。因為客戶端只有升級才會更新新的打點代碼。並且還有升級覆蓋率問題。所以一定要把數據框架打好,否則後續進行數據分析會非常困難。

如果是前端打點就方便很多。根據需求隨時調整,隨時上線,而且用戶刷新一次頁面代碼就能被升級上來。不過經常變動也會讓工程師重複工作,影響工程師情緒。

步驟二:

提供打點需求,就是明確在什麼情況下要什麼數據,最終為什麼分析做準備。

並且一定要弄清楚指標的正確定義

比如,次日留存,30日留存,月留存,新用戶次日留存,都是什麼意思,有什麼區別。

問題:產品經理應如何提供打點需求?尤其是當產品經手一個不熟悉的項目時。

個人習慣先跟相關同事溝通,然後窮舉,之後篩選出核心指標,重要指標,次要指標,檢測指標。有條件的話可以再請資深人士評估下。雖然耗時,但穩妥。

窮舉的過程從每個入口和頁面逐一列舉開始:比如對一個手機軟體,起點應該從應用商店下載開始,終點是用戶卸載。然後是每個地方的入口pv,uv,按鈕點擊及對應uv,內容曝光及對應點擊、對應uv,時長及對應uv,輸入內容及對應uv,以及特殊信息如購物類的客單價等。

並且可以按照新老用戶,或者分級用戶,按渠道切分對比。預留好各個渠道ref介面。如果有AB試驗,則需要支持試驗對比。

釋義:

核心指標:一般都會包括DAU,MAU,平均時長,人均啟動,日新增,關鍵轉化(比如訂單轉化,閱讀轉化)日卸載。新老用戶留存(日周月)。如果有內容則會增加曝光量,曝光點擊,曝光點擊率,人均曝光等(ps 其他KPI的相關指標都應該列為核心指標 )

重要指標:一般是核心操作,重要內容,關鍵路徑的相關打點數據。流量分布,漏斗或者也叫流失模型。如視頻播放vv,客單價,搜索量等等。

檢測指標:一般就是錯誤提示或者性能參數,失敗反饋等信息上報。能有效反饋設計質量和工程質量。

其他指標:可以歸結為次要指標,一般是輔助性或驗證性。或者某些功能上線之初效果評估。

注意事項

a 數據項要能完成關鍵路徑的漏斗模型。

漏斗模型示意圖:

b 打點數據最好能帶著用戶參數,渠道參數,入口參數,從而能有效追述用戶路徑,評估渠道,評估入口,分析新老對比等。

舉例,上一個之前做過的「資訊詳情頁面」統計需求

ps 表中關於曝光的統計就是需要特殊說明的,產品經理不能簡單的四個字「統計曝光」就提給工程師,如果有特殊需求要標註清楚給工程師。

________________________

2)數據使用:

數據分析包括後台呈現、分析、彙報三部分。

2.1 後台呈現:

數據呈現是為了方便快捷直觀的觀察數據情況,分為表格圖表兩種形式。表格需要支持導出,從而方便深入計算。圖表最常用的就是折線圖(看趨勢),柱狀圖(看關係),餅圖(看比例)。

但是過於複雜的後台呈現會導致過多工程資源消耗,因此建議初期以基本數據能正常呈現和導出為標準即可。然後手動分析數據走勢和之間的邏輯關係,經過人工的分析充分掌握數據規律,然後再優化後台呈現,這樣更方便高效,並且在項目初期數據變化較大隨時可能面臨調整。

同時關於篩選條件一定要制定好,並能方便的多維度進行對比。如:按新老用戶,按渠道,按版本,按入口,按時間粒度。

當然對於已經成熟的項目和呈現後台則另當別論。

(ps miui有很多數據分析後台,防止泄密這裡就不上示例參考了)

2.2 數據分析

數據分析首先要具備一定的數理統計知識。這個是必須學習的功課了。

比如如何區分平均數和中位數的作用?什麼情況下看平均,什麼情況下看中位數。

個人看過的統計相關書單:

《愛上統計學》(美)尼爾.J.薩爾金德 重慶大學出版社

《統計學原理》 張瞳光 中國商務出版社

《統計學導論》 李 勇 人民郵電出版社

《應用統計學》 朱建平 清華大學出版社

《數據挖掘概念與技術》 韓家煒等 機械工業出版社(可以不看

其次熟練掌握excel

比如是否能夠使用分列、分級、透視等幾個功能。(篩選,排序等功能太小兒科了)

比如是否能夠使用IF、COUNTIF等公式(SUM太小兒科了)

再進階的話就是使用VB語言進行分析。

個人的學習excel經驗是在實踐中摸索,對於這種基礎軟體沒有必要專門買教程學習,每次根據需求百度,然後做好筆記即可。

本人也使用過spss,不過作為產品經理excel足夠用了。

最後數據分析工作重點:

a 日常監控相關數據的變化和波動,並總結規律,比如對於時鐘應用可以看到每周會呈現相對規律的變動。對於出現異常波動的數據要及時跟進。

實操舉例:

圖中圓圈處數據,斷崖式,斷崖時間1天,很有可能是數據統計變更或後端or前端打點出現問題。

圖中方框處數據,呈現明顯周期性規律,並且微微上揚。能夠直觀體現用戶使用行為和高峰,從而確定產品優化點和關鍵運營時間。微微上揚則能表現出入口流量增長或流失減少,又或者留存提高。

b 關鍵漏斗模型的建立和監測。對於流失率較高的環節及時跟進和優化。

c 對於功能改進,運營效果,商業變動的數據總結和分析,有問題需及時進行調整。

2.3 數據彙報:

數據彙報太偏重技術表現不再展開說明,核心重點:區分不同的彙報場景選取關鍵數據,針對有效數據選擇恰當的表現方式即可。說明問題即可,不用面面俱到使得彙報冗餘。

________________________

3)數據預估:

相對於數據打點和數據使用,數據預估是更重要的能力,其需要建立在豐富的數據經驗和統計知識的基礎之上,也是產品經理對自己項目把控力的重要體現。

當一個產品能夠相對準確的預估項目數據變化及相關優化後的數據波動,就能夠有效的根據項目情況和資源情況安排產品重點和進度。做到進退有度。如假設產品經理要將產品日活從年初100w年底提升至500w。首先要能夠準確預估期間有哪些手段能影響用戶量提升,各自提升效果有多少,資源投入有多少,見效周期是多少。從而安排工作重心和節奏。這個時候對數據預估的準確性則會直接影響產品的發展速度。

對於高級產品或者背負KPI的產品,必須具備數據預估能力。從而合理安排工作計劃,帶領團隊有效的推動項目發展。

這裡總結下個人經驗,首先要拆解某項數據指標,比如營收數據,要根據項目的營收結構逐項拆解,其次了解每一項的波動規律。如某些同活躍用戶波動相關、某些同時間或節日波動相關、某些同大盤數據波動相關。同時要了解歷史上相關波動幅度。以及用戶潛力,比如瀏覽器搜索用戶佔比可以提升到40%以上。

如果有工程資源,最好能針對某些重要的改進提前進行抽樣測試,從而推斷全局後的數據變化情況。比如我們建立起版本灰度機制,一方面更好的發現bug,另一方面能及時評估版本全量後的數據變化,從而判斷是否對當前版本進行全量。

(ps 這個地方的工作成果太過涉密,就不上示例了。)

________________________

結尾的注意事項:

1)數據不能代表一切,不能盲目的相信數據,但是更不能的是不看數據、不懂數據。

2)很難追求數據的絕對準確,而要追求數據的相對準確。

3)不要感覺數據有問題就衝到工程師面前,要切實分析出問題。秉持誰提議誰舉證的原則。

4) 一定要弄清楚指標的定義,不能似是而非。

5)數據分析是一個嚴謹的邏輯過程,要保證推斷的客觀性,不能為了證明某結論而證明。

6)數據分析是隨著產品發展而不斷細化和迭代的,不要在開始階段就投入大量資源進行數據分析。

寫在最後

隨著項目的日益發展,數據分析也會更加精細和複雜,因此慢慢的出現了數據產品經理,對於數據產品經理還是應該學些基礎的Python、SQL、VBA技能。

說些題外話,數據是簡單、直接的,也是飽受爭議的。

但當真正看到龐大的數據所表現出的特徵後,你會震撼於從未感知過的世界的另一面。

無論如何必須要感激當前的科技進步能夠讓我們有機會直面數以億計的人產生的成百上千億的行為。就像一粒水終於可以看到整個大洋的流動,就像上帝打開一扇窗讓我們從他的角度俯視大地。

你會真正糾結於是否要為滿足幾千萬人的需求放棄其他幾十萬人。這不再是課本上的哲學命題。

你會興奮於幾千萬人按照你的設定向預期的結果發展。這有一種替上帝做決定的成就感。

你會深思低俗文章的點擊率難以讓正規文章望其項背。必須一遍遍權衡其中的利弊做出讓步。

最後再說一點互聯網圈外人特別關心的數據隱私的事情,擁有這些大數據的公司不會八卦你到底是誰干過啥。它們只關心人群的趨勢和方向,從而怎麼更好的服務用戶產生價值。

只有政府、變態和騙子才會關心和利用你個人的信息。而且騙子會通過各種渠道手段獲取你的信息,所以對待自己身份信息和財務密碼信息一定要謹慎。

關於文章:

以上來自於工作中的實踐總結,不過由於工作太忙文章是在上下班路上一點點寫的,著實感覺寫東西不容易啊。歡迎大家多多討論。

個人其他回答鏈接,大家的鼓勵是繼續寫下去的動力~~

有大公司 offer 卻選擇了小公司是為什麼? - 大禹的回答

產品經理如何進行競品分析? - 大禹的回答

如何有效地進行頭腦風暴產生IDEA? - 大禹的回答

用戶研究需要注意哪些問題呢?怎樣做好用戶研究呢? - 大禹的回答

互聯網思維是一種什麼樣的思維? - 大禹的回答 - 知乎

多謝大家捧場,寫文章不容易,喜歡的點個贊吧。個人微信公共號「真實的互聯網」 gh_37dac85b8f9e。會定期分享個人心得,歡迎大家關注

http://weixin.qq.com/r/PUVocA7EwVO_rUoT9xAv (二維碼自動識別)


有些數據是必要的,PM對數據的需求很大層面上可以反映產品經理對數據和業務的掌控理解能力和對產品的期望,所以足夠聰明的產品經理不會漫無目的的要數據,一般會重點盯幾個產品的關鍵指標和決策必要的指標;相對的,一個好的數據分析師需要對數據的需求做出合理的把握,不是需求方要什麼就給什麼,數據分析師給出的數據必須是有效的,能夠指導決策的,而不是冗長的毫無重點的數據報表。

最後說一句,數據只是輔助決策,而不是決策的本身。


數據是客觀存在的事實的反映

但是如何解讀數據往往是片面和主觀

所以需要數據引導,更需要豐富的經驗去解讀數據


用數據說話不代表著跑數據,調研一下更不代表著跑數據。

用數據說話不是用數據做決定。在互聯網行業里,PM自身的判斷能力非常重要,也是在招聘PM時非常關注的點。

PM的判斷如何更可靠?可以用數據進行輔助,在關鍵問題上,需找核心的數據、理論、邏輯分析來支撐判斷。

問題中也提到了「有些數據是肯定必要的,有些數據是可要可不要的」。其實一個好的PM需要搞清楚哪些是作出判斷的關鍵點(關鍵點,不只是數據),並以此搞清楚到底需要哪些數據。

如果一個PM不重視數據,那就不是判斷而是拍腦袋甚至只算是拍胸脯而已。

如果一個PM每次都是用一堆詳細的數據去判斷每個問題,一方面這本身就是不可能的,另外一方面這個PM也沒什麼價值。

此外還要說明的是,數據本身也是培養PM判斷力的主要教材。


他跟你講「產品經理的直覺」,講「用戶體驗」,講「你就大概照這樣抄一個」,你會不會更想揍他?


從問題的描述來看,偏向於確定數據分析對新功能或者優化功能的決策有多大的幫助

產品需求的決策一般是看需求的急迫性+需求的場景大小

一般可以通過數據了解該場景下的受眾來確定需求的場景大小

比如微信掃一掃聽歌和朋友圈對比,簡單的通過數據即可判斷

下面說說我的經驗,在什麼情況下,需要分析數據進行決策

1、新功能或者新產品,目的:確定是不是要做(可能領導從戰略角度確定要做了),盤子能做多大(提升團隊的信心,畫餅)

  • QQ群想切入教育市場,用戶可以利用群完成教學相關的工作,除了做市場的數據分析,還需要對現在群的數量、類別做個分析

  • 微博需要在timeline增加分類的需求,判斷分類是否需要加上轉發呢?可能看到數據80%的轉發,得出結論篩選的意義不大(暫時只討論數據,用戶場景也是重要因素)

2、活動運營或是優化功能,不同的決策會導致差異會很大

  • 策劃一個積分兌換活動,需要對全盤的積分和用戶的數據進行分析,如果兌換比例低了,可能很快換完了獎品,比例高了,用戶沒有積極性

題主提到的問題,應該是不同的決策,最後的差別不會太大的例子,這種時候跟開發的溝通就可以是3級也好,4級也好,確實都可以呀

另外補充幾個點

需要考慮數據獲取成本,尋求最佳性價比高,有些時候確實應該先靠產品經理的一個決定,上線後再去調整,如果是一個隨手可以跑出來的數據,比如題主提到的等級,應該都有現成的數據,看下每個等級的人數就可以了

需要明確數據的用途,如果需要一項數據,想想如果這個數據高,你會怎麼決定,如果這個數據的值是多少,你會做什麼決定,這個問題想不清楚,那這個產品決策就不是分析數據這個環節的問題

補充一句題外話,有時候產品經理提數據需求,不見得一定是當前有用,可能就是對產品的直觀的把控,也鍛煉產品經理的產品感而已


數據分析在絕大多數情況下只是實現了一個知識整理的過程~


電影《美麗心靈》有一幕讓我非常感動:納什坐在校園長椅上,身前是一堆在進食的白鴿,他手上的筆在草稿紙上飛快地演算著,納什居然希望用數學來演繹鴿子的行為!我的觸動不僅僅是因為他對數學事業的痴迷,也是因為對這個世界的重新認知。或許世界真的是可以用」數據「解釋的,就像《駭客帝國》一樣,我們其實生存在虛擬的數據當中。

讓我們從哲學思考回到現實層面,且不管世界如何構成,我們所在的企業的運轉一定離不開數據。如果說產品、服務是支撐企業的骨架,那麼數據則是穿梭其中的血液,把營養運輸到每一個需要的細胞。

數據最本質的作用,是作為資源調配的裁判,幫我們用最客觀的方式提高企業運作效率。

有的人天生對數字不感興趣,面對一堆數據會覺得無從下手,一般對它都是敬而遠之。但當產品經理能給熟練運用數據幫助工作的時候,就會愛上數據,從某種程度來說,數據是一把尚方寶劍,對團隊工作和個人成長都大有裨益。

(1)目標導向

記得有一次和大老闆開會,Boss問到:你們這個地方的目標是啥?

我們答:提高品牌知名度,提高用戶體驗……

Boss迷之微笑,說:你們說的這些都沒法衡量,既然我們是在攻堅時期,那麼就拿出點真正有意義的指標來指引我們的工作,比如說這裡的點擊率,現在是5%,那你年底的時候能不能做到6%呢?只有盯著這些數據,才能給我們一些壓力,朝著明確的目標去工作。

只要在職場工作開始工作一小段時間的人,應該都知道「目標導向」的重要性。那麼怎麼把這句口號式的術語運用到實際工作中呢?答案就是數據。

在周會、月會,甚至年度會議上,我們所談論的東西,基本都能用數據來衡量。因為這些數據指標,才能把大家拉到同一緯度來對話。

比如說用戶體驗,什麼才是好,每個人有自己的判斷。設計師可能覺得是畫面美、動畫流暢,工程師可能覺得是反應速度快、不出bug,而產品經理可能覺得是行業口碑、用戶反饋等,眾說紛紜。但是,如果落實到數據上,則不會出現主觀的判斷,用戶體驗就是我們的留存率從30%提高到35%,點擊率從5%提高到6%等等。

(2)效率優化

當我們說到大公司,第一反應可能是坐擁巨大的資源,可以「秒殺」所有小公司,讓人羨慕不已。

其實不管公司大小,資源都是有限的,因為地球本身的資源就是有限的。似乎人的一生都在為爭取資源而奮鬥,公司工作也不例外。

從公司的角度而言,尤其是業務分散的中大型企業,看著數據來分配資源已經是無可爭議的經營法則。其中最著名的案例當屬騰訊跟京東的電商整合。由於缺乏「電商基因」,連年虧損,騰訊把ECC(電商控股公司)與京東整合。騰訊獲得京東15%股份,而京東獲得騰訊巨大的社交流量,這一雙贏戰略引起中國互聯網界極大關注,開啟了國內互聯網的資本、業務整合風潮。

從個人角度而言,數據也可以幫助自己整理工作的優先順序。例如,我上半年的KPI是會員收入做到1000萬,而現在手上有10個工作等著完成,那麼這些工作做完之後,每個項目大概能為KPI貢獻多少呢。假如需求a是做一個「1元秒殺」的活動,需求b是把會員主頁設計得更漂亮一點。那麼在資源有限的情況下,一定是優先完成需求a,因為按照以前的經驗,做一個活動是最直接有效的,每次都能拉動100多萬的營收,而把會員主頁設計得更美觀縱然有助於提高用戶體驗,但卻沒有太大的收益,即ROI不高。

ROI指投資回報率(Return on Investment),指通過投資而應返回的價值,即企業從一項投資活動中得到的經濟回報。對於一個團隊來說,「投資」就是程序員精力、伺服器資源、運營人員投入等,回報則是這些工作完成之後,對於團隊所負責產品的提升作用。

團隊的每一個成員都應該有很強的ROI意識,尤其是產品經理。我曾經在辦公室聽到了一次「小爭吵」,一位產品在跟項目經理PK,產品說「這個需求怎麼還排不上呢?這裡每天都要損失10萬多的收入,看著都心疼,雖然其他需求也很重要,但是這個需求明顯更緊急一點,求排期!」。此話一出,項目經理也無可反駁了,馬上把在做其他需求的開發哥哥安排去支持她的需求。每個需求對產品都有個「貢獻值」,這個數據就告訴項目經理,甚至老闆什麼地方改投入更多資源,什麼地方應該壓到後面。

我們前面說到,數據就是「尚方寶劍」,如果可以給出有信服力的數據,那麼自己負責的工作就會暢通無阻,甚至能得到老闆的特批。

(3)解決爭議

產品經理第一特質,可能就是「溝通」了。正所謂有人的地方就有江湖,溝通過程總不會是一帆風順的。

在一個平台型的產品中,資源的分配受到很多團隊的關注,多一個入口、多一天推廣,對於這個團隊的KPI來說,都是至關重要的。所以這些地方也特別容易引起內部的爭議。

那試想一下,兩個團隊爭起資源來,要怎麼調節呢?嗓門大或者氣勢凶就可以解決嗎?還是說找老闆協調呢?最有用的方法還是用有說服力的數據。例如焦點圖就5張,而且有排位,應該把誰放在第一位就看數據表現。放A團隊的,有3%點擊率,B團隊只有1.5%,毫無疑問,我們就是要把第一位給A團隊。

因此,一旦有人問到,憑什麼這張焦點圖可以放第一位?我們其實根本就犯不著爭吵,數據放出來,A是最高,大家還有什麼可以質疑的嗎。

蠻多人喜歡一出現問題就找老闆,誠然,很多時候要找老闆才能解決問題。但是,就算是找老闆,Boss也是需要判斷依據的,一般情況下Boss也是看著數據來解決爭端。有一個我很佩服的老闆,她的經典口頭禪就是:這個數據表現怎麼樣?每次調節團隊之間的糾紛,都以數據為準,所以下面也是心服口服,毫無怨言。

在一個數據導向的團隊中,會工作得非常順利,因為大家盯著數據來安排資源,避免了許多主觀的爭議。


數據是可量化、可分析、可測量的,直覺並不一直可信。所以需要用更簡明客觀的數字來說話。

ps:「拿數據說話」和「沒事跑數據、拖延時間、不做事、等等等」是兩回事哦~


推薦閱讀:

一個工作兩年,考慮轉入互聯網行業的人,想問問關於產品、運營、市場這類非技術崗位的職業發展狀況是如何的?
雲朵兒童安全鞋 為什麼沒能火起來,是需求定義有問題,還是產品做的有問題,或者商品定價和推廣方面有問題?
如果夫妻倆都干互聯網產品(不是工程師),會出現哪些有趣的事?
作為產品經理和消費者,你能從雙十一里學到什麼?
運營做的活動都有哪些?

TAG:產品經理 | 數據分析 | 互聯網數據分析 |