如何做基於地理位置信息的用戶行為分析?

有一堆用戶行為記錄數據包含用戶ID,經緯度,時間。怎麼來做用戶行為軌跡的分析,比如什麼時候去了哪裡?什麼時候跟朋友一起?怎麼分析用戶是否在「家」或者在外旅行?有什麼經典的演算法沒?如何來驗證分析的效果定性?

目前我用EXCEL與SQL分析出了一些比較直觀的數據但是似乎對於用戶行為軌跡的幫助並不大,希望大牛們能給出一些指點,應該從什麼樣的方向去思考會比較好?


大致說下思路吧。。

1、GPS在信號較差或者有遮擋的時候會出現漂移,基於基站的定位精度與基站數量和分布有關,精度往往較GPS低,而且也不太穩定。所以得首先去除漂移點,方法有連續三點的拐角大小,根據速度閾值判斷,局部自相關分析等。。之後還可以對去除漂移之後的點做插值或者什麼,不過我感覺這個意義不是很大

2、對處理之後的數據進行聚類,常用方法有DBSCAN(基於密度)和K-Means(得確定中心數)等,提取用戶的重要停留點,構成行為網

3、利用用戶活動範圍內已有的熱點區域,對用戶的停留點和已有的POI進行匹配,然後瞎扯一些結果。

4、根據用戶訪問的時間順序構成的出入度行為網(自己編的個名詞),分析熱點區域之間的關聯性什麼的

5、還可以根據軌跡的相似度匹配分析用戶之間的相關性,再依據你已有的其他用戶信息數據(如果有的話)進行深一度挖掘,比如分析用戶常去的興趣點和消費水平、工資的關聯性什麼的。。

後面幾點是我認為可以想的幾個方向,具體做什麼、怎麼做,還得看你到底有什麼樣的數據,以上。


實際的數據是很坑爹的。


移動軌跡數據分析與智慧城市,這篇文章不錯啊,浙大的,國產的。


一個人地理位置的數據可能會顯示出他的生活狀態。比如他待的時間最長的地方可能是工作地方或是住所,如果是在租金廉價的地段,可能表示他的生活質量不高,很可能會經常去大型會員制經常搞促銷的超市,蒼蠅館巴拉巴拉巴拉,消費比較看重實用性,日用品消費居多,可能會經常跑路,也許會有輛電驢或者自行車。。。如果他待的比較時間長的地方是在商業區,地點變化的時間比較規律,可能是上班族,上網時間比較多,作息比較規律,周末時間出現的地點可能是習慣性地社交場所,比如又出現在商業區、酒吧、夜店,這樣的人花起錢來可能會大手大腳,衝動消費比較多。如果上班下班時間段會出現在地鐵沿線,可能表示沒什麼存款沒錢買車。。。

僅僅是猜測啊,類似這樣吧,充分發揮想像力,把自己置於假設的環境想想自己會怎樣生活,多觀察,希望對你來說算是拋了塊兒磚


上面 @yycyycyy 說的挺好,補充幾點。

從這些數據中能夠發現什麼,與數據的生產場景、用戶某個動作的上下文、數據的粒度都有很大關係。舉個栗子,拿「行者「app的用戶騎車出遊的數據,是很難分析出他運動以外的用戶行為特徵的。如果時間粒度較大,(例如,簽到數據就不是高頻率的用戶行為)基於這類數據就難以發現用戶每天的生活規律。

做數據挖掘與知識發現重要的是深入業務和場景,之後再再考慮用什麼演算法和模型。

演算法或模型效果的驗證,一般是從查准率和查全率兩個方面評估結果。當然,你首先要有真實的樣本。


我的一個小實驗~~ 利用 DBSCAN和Kmeans 混合了了一個小演算法實現~

用戶地理位置的聚類演算法實現


從日常經緯度變化得到客戶居住,工作,及節假日運動軌跡,這些在計算上都不成問題。做過通過地理位置找到附近的人去營銷,效果還行。其他更好的場景去應用,一直在摸索


會不會太隱私了?連我是不是在家都能判斷?感覺不安全誒。


推薦閱讀:

扁平化設計與後現代繪畫風格有聯繫么?
「去論壇化」會是互聯網社交產品以後的趨勢嗎?
點點大多數模板文章最終頁,為什麼設計成圖片在上文字在下?
厲害的產品經理相對於普通產品經理,對於完成一個項目來說,除了更少的時間,還有什麼優勢?
Quora 的 Best Source 有什麼作用?實現的邏輯是什麼?

TAG:產品設計 | 用戶行為 | 用戶研究 | 行為分析 | 地理位置 |