數據埋點是什麼?設置埋點的意義是什麼?
剛剛工作,遇到好多新的名詞,請教知乎大神。做一個項目的時候需要設置數據埋點嗎?他的意義是什麼?設置這個的工作量有多大?是不是要根據每個項目設計不用的埋點呢?
PS我是運營
所謂「埋點」,是數據採集領域(尤其是用戶行為數據採集領域)的術語,指的是針對特定用戶行為或事件進行捕獲、處理和發送的相關技術及其實施過程。
埋點的技術實質,是先監聽軟體應用運行過程中的事件,當需要關注的事件發生時進行判斷和捕獲,然後獲取必要的上下文信息,最後將信息整理後發送至伺服器端。所監聽的事件,通常由操作系統、瀏覽器、APP框架等平台提供,也可以在基礎事件之上進行觸發條件的自定義(如點擊某一個特定按鈕)。一般情況下,埋點可以通過監測分析工具提供的SDK來進行編程實現。
埋點的業務意義顯而易見,即幫助定義和獲取分析人員真正需要的業務數據及其附帶信息。在不同場景下,業務人員關注的信息和角度可能不同。典型的應用場景有面向數字營銷領域的分析,以及面向產品運營領域的分析。前者注重來源渠道和廣告效果,後者更在意產品本身流程和體驗的優化。兩者各有側重,也可以有一些交叉。所以,對於不同的項目和分析目的,應當設計不同的埋點方案。
近年來,埋點的方法論上也出現了一些業界新趨勢,如「無埋點」技術。所謂「無埋點」,是指不再使用笨拙的採集代碼編程來定義行為採集的觸發條件和後續行為,而是通過後端配置或前端可視化圈選等方式來完成關鍵事件的定義和捕獲,可以大幅提升埋點工作的效率和易用性。在「無埋點」的場景下,數據監測工具一般傾向於在監測時捕獲和發送儘可能多的事件和信息,而在數據處理後端進行觸發條件匹配和統計計算等工作,以較好地支持關注點變更和歷史數據回溯。當然,即便是「無埋點」技術,也仍然需要部署數據採集基礎SDK(又稱基礎代碼),這一點需要注意,容易產生誤區。
如果需要了解更多關於埋點的詳細信息,可以閱讀宋星的文章:
By 何愷鐸
作者:大頭魚
鏈接:https://zhuanlan.zhihu.com/p/25195217
來源:知乎
著作權歸作者所有。商業轉載請聯繫作者獲得授權,非商業轉載請註明出處。
所謂埋點就是在應用中特定的流程收集一些信息,用來跟蹤應用使用的狀況,後續用來進一步優化產品或是提供運營的數據支撐,包括訪問(Visits),訪客(Visitor),停留時間(Time On Site),頁面查看(Page Views,又稱為頁面瀏覽)和跳出率(Bounce Rate,又可稱為蹦失率)。這樣的信息收集可以大致分為兩種:頁面統計(track this virtual page view),統計操作行為(track this button by an event)。
數據埋點的方式
現在埋點的主流有兩種方式:
- 第一種:自己公司研發在產品中注入代碼統計,並搭建起相應的後台查詢。
- 第二種:第三方統計工具,如友盟、百度移動、魔方、App Annie、talking data等。
如果你的數據來自第二種,那你使用的工具也應該是第三方統計工具,後續沒啥數據產品了,好好用這些產品吧。這裡說說第一種的埋點方式吧,怎麼數據埋點,就需要根據自己產品的任務流及產品目標來設計。
關鍵指標
我們先看看無論是APP還是H5都會關注的指標,了解這些指標的計算方法的細微差異以及複雜性,換個角度來思考埋點的意義。【源自:精通Web Analytics 2.0】
- 訪問與訪客
訪問(Visits)與訪客(Vistors)是幾乎所有應用都需要統計的指標,這也是最基礎的指標。
對於應用的統計來說,希望統計的是訪客(Vistors)。訪問(Visits)是指會話層,用戶打開應用花一段時間瀏覽又離開,從指標定義來說這杯稱之為一個會話(Session)。一次會話(Session 或 Visit)是打開應用的第一個請求(打開應用)和最後一個請求決定的。如果用戶打開應用然後放下手機或是離開電腦,並在接下來30分鐘內沒有任何動作,此次會話自動結束,算作一次訪問或會話期。
在計算訪客時,埋點上報的數據是儘可能接近真實訪客的人數。對於獨立訪客這個指標,這裡還是需要強調一下,獨立訪客數並不是真實獨立的人,因此收集數據時必須知道獨立訪客雖然能夠很好的反映使用應用的真實訪問者的數量,但不等於使用應用的真實人數。
原因是,重複安裝的應用,或是手機參數被修改都會使得獨立訪客的指標收到影響。獨立訪客的埋點都是依賴Cookie,用戶打開應用,應用都會在此人的終端創建一個獨立Cookie, Cookie會被保留,但還是難免會被用戶手動清理或是Cookie被禁用導致同一用戶使用應用Cookie不一致,所以獨立訪客只能高度接近於使用應用的真實人數。
- 停留時長
停留時長用來衡量用戶在應用的某一個頁面或是一次訪問(會話)所停留的時間。
頁面停留時長,表示在每個頁面所花費的時間;例如:首頁就是進入首頁(10:00)到離開首頁進入下一個頁面(10:01)的時長,首頁停留時長計算為1分鐘。頁面A是2分鐘。頁面B進入時間(10:03),離開時間沒有記錄,這時候計算就是0 ,這種特殊情況的處理是需要在埋點特別注意的,還是那句話,不要嘗試收集絕對精準的數據,要學會使用不全的數據,活學活用。
應用的停留時長,表示一次訪問(會話)所停留的時間,計算起來就是所有頁面的訪問時長,同樣是上一個流程,應用的停留時長就是4分鐘。
- 跳出率
跳出率的計算方法現在在各個公司還是很多種,最精彩被使用的是:單個頁面訪問的所佔的會話比例。這種場景意味著用戶來了訪問了一個頁面就離開了,想想用戶使用的心裡畫面應該是:打開應用,心想什麼鬼,然後關閉應用甚至卸載了。這個場景多可怕,這也是為什麼跳出率指標被如此關注。
跳出率可以分解到兩個層次:一是整個應用的跳出率,二是重點的著陸頁的跳出率,甚至是搜索關鍵詞的跳出率。跳出率的指標可操作性非常強,通過統計跳出率可以直接發現頁面的問題發現關鍵詞的問題。
- 退出率
退出率是針對頁面的,這個指標的目標很簡單,就是在某個頁面有多少用戶離開這個頁面,主要用戶反映用戶從應用離開的情況。哪些頁面需要被改進最快的方式被發掘。(有些流程中設定走完標準流程,退出率最高的在標準流程的最後的頁面反映的正向呢,不要認為退出率高都是壞的事情哦)
- 轉化率
我們在產品上投入這麼多,不就是為了衡量產出么?所以對於電商類應用,還有比轉化率更值得關注的指標嗎?轉化率的計算方法是某種產出除以獨立訪客或是訪問量,對於電商產品來說,就是提交訂單用戶數除以獨立訪客。
轉化率的計算看起來想到那簡單,但卻是埋點中最貼近業務的數據收集。這也是最體現埋點技巧的指標,需要結合業務特點制定計算方法。提交訂單量/訪客數是最基本的轉化率,轉化率還可以分層次,指定用戶路徑的,如:完成某條路徑的提交訂單數/訪客數。
試著找一條路徑,想想轉化率的數據怎麼得來的吧,埋點都收集了什麼樣的數據吧?
- 參與度
參與度並不是一個指標,而是一系列的指標,訪問深度,訪問頻次這些都是衡量參與度的指標。之所以把參與度列為一個指標,是希望大家明白把指標組合後續產生化學反應,發現實物的本質。
埋點的內容
看完關鍵的這些指標後,有沒有發現埋點的來源也大致分為兩部分,一部分是統計應用頁面訪問情況,即頁面統計;另外一部分是統計應用內的操作行為,及自定義事件統計。
頁面,事件都被唯一標記,用戶的信息,設備的信息,時間參數被附加上報。這就是埋點。
關於埋點的數據的注意事項
- 不要過分追求完美
關於埋點數據有一點至關重要,埋點是為了更好地使用數據,不要試圖得到精準的數據要得到的是高質量的埋點數據,前面討論跳出率就是這個例子,得到能得到的數據,用不完美的數據來達成下一步的行動,追求的是高質量而不是精確。這是很多數據產品容易入坑的地,要經常提醒自己。
數據埋點分三個階段:初級的數據埋點:在產品流程關鍵部位植相關統計代碼,用來追蹤每次用戶的行為,統計關鍵流程的使用程度。
中級的數據埋點:在產品中植入多段代碼追蹤用戶連續行為,建立用戶模型來具體化用戶在使用產品中的操作行為。
高級的數據埋點:與研發及數據分析師團隊合作,通過數據埋點還原出用戶畫像及用戶行為,建立數據分析後台,通過數據分析、優化產品。
埋點的意義:
數據埋點為了統計分析的需要,對用戶行為的每一個事件進行埋點布置,並對這些數據結果進行分析,進一步優化產品或指導運營。
數據埋點是一種良好的私有化部署數據採集方式。數據採集準確,滿足了企業去粗取精,實現產品、服務快速優化迭代的需求。 簡單的說,找節點,布代碼,收數據。
數據埋點可以分為三個階段: 代碼埋點 、 框架式埋點 (也稱為可視化埋點)以及無埋點。
但隨著業務規模擴大,數據需求增多,埋點效率低下,採集成本過高等問題開始暴露, 越來越多的公司開始注重無埋點技術。
曾經在一個公眾號中,看過一篇文章,寫的不錯,推薦給您!我上面說的,大多也是摘自這裡
數據分析產品的下一個進化:基於無埋點的有埋點
侵刪!
之前看過一個類似的文章,這裡想引用一下,希望對你有幫助:產品設計思考:廣告位埋點,這個需求有何意義?
想問一下一個數據埋點工程師到底是做什麼的,需要什麼技能?
數據埋點實際上就是pm或運營分析人員,基於統計分析需要,對用戶行為的每一個事件進行埋點布置,並通過SDK上報埋點的數據結果,進行分析,並進一步優化產品或指導運營。
推薦閱讀:
※產品數據分析需要注意哪些問題?
※談談你覺得好的BI(商業智能)產品是怎樣的?
※MATLAB入門有什麼材料推薦?
※BP神經網路是否優於logistic回歸?
※想學Python做數據分析,請教安裝問題?