請教如何做用戶行為路徑分析?用python或者R實現!

背景描述:目前我從數據倉庫調出了一個月的用戶日誌數據(上億條左右),這些數據欄位有:用戶id,用戶訪問次數sid,用戶訪問步驟seq,用戶訪問時間visit_time,用戶點擊事件event,用戶訪問url等。

需求:找到用戶行為規律,為產品優化以及用戶運營提供支持!

補充:

我在百度上和知乎上找到的相關帖子,與下面這個帖子講的差不多,看了下基於關聯的序列分析和鏈接分析確實滿足我的需求,但是他們說的都是理論,沒有舉出實例實現。我想最好能有相關實現代碼(python或者R)就好了,謝謝!

如何做用戶行為路徑分析? - 諸葛io - 知乎專欄


你既然會python,又有數據,直接一步步來就好了。

按時間分割出會話,然後把每個用戶的行為路徑整理出來,然後匯總就得出路徑數據……

下面是我最近做路徑優化的總結,希望可以幫到你~~~·

一、什麼是路徑?

用戶完成一個目標所經過的操作序列(自己的理解)。

二、怎樣做路徑分析和優化?

1.整理產品所支撐的全部或主要工作流。其實從產品功能做切口最佳。

下面是我整理廣告系統的工作流

2.根據工作流整理用戶路徑表

根據工作流整理出路徑,包括階段、環節、行動(操作)、發起者、動作、入口。這個表代表了產品設計者的期望,一會兒需要與實際路徑做對比,然後進行優化。

3.整理實際的用戶路徑

  • 埋點,收集收據,整理log,分割會話,整理出路徑
  • 分析路徑(可以使用頁面、動作,也可以用詳細的操作或者頁面,是否分用戶角色等,根據具體情況來)

案例:一個垃圾站2天的log生成的分析(並未做埋點工作,只是簡單做個分析

數據:http://7xr10r.com1.z0.glb.clouddn.com/visit-sequences.csv

頁面:Sequences sunburst

4.分析、優化

原則

a.有明確的目標,此處以提高用戶的效率和效能為目標;

b.尊重用戶的實際習慣,好的壞的習慣都值得產品設計者尊重、思考;

分析(對分析路徑我的經驗不多,簡單總結下)

a.結合產品體驗分析路徑表

上面整理的路徑表代表了設計者期望用戶的路徑、動作,但不代表合理、高效。對照表中的階段、環節、操作進行實際操作,觀察思考哪些可以優化。大的方面交互、功能、內容、架構都會對路徑產生影響,這一步也可以群策群力,團隊一起完成。我對這點沒有太系統的方法,幾乎每次分析都能發現改進的點,可以多次嘗試。

b.結合實際路徑分析路徑表

有不少產品設計者看了sunburst這樣的路徑圖也沒什麼益處,因為對產品的細節和全局了解可能不足,所以把這個步驟放在第二步進行。

我的典型做法是根據關鍵動作的埋點提取特定的操作或者工作流,觀察與期望的差異,思考優化。另外,可以直接看出各種操作的數量,對確定重點很重要,這個不是頁面維度的重點,是用戶行為維度。

路徑分析是個苦力活兒,沉下心來一點點觀察思考往往能得到很好的效果。


我也在研究這個問題,請問題主,現在有沒有找到比較好的方法?


推薦閱讀:

了解關於系統推薦演算法的知識,有什麼好的資源推薦?
從原理上來說,GBDT 和 SVM 哪個更強?為什麼?
南京大學LAMDA(周志華)組的實力如何?

TAG:Python | 數據挖掘 | 用戶行為 | R編程語言 |