Adidas、金拱門、KFC、樂天瑪特,零售巨頭的選址秘訣都在數據里了
文/何宇兵
在當前複雜的零售環境下,選址對於零售企業而言變得格外重要,因為位置就是線下流量的直接入口。近期數據俠實驗室,DT君邀請到了GeoHey·極海上海分公司的技術總監何宇兵,他將從三個維度來為大家揭曉如何通過地理方法解決選址問題?融合機器學習的智能地圖如何賦能商業選址?
1.0時代:地理可視化
1.0時代即通常所說的數據上圖,將數據投放至地圖上,用地理可視化的方式展現出來。
佳通輪胎是我接觸這一行業所做的第一個項目,這一項目對於現在而言能輕而易舉地做到並且能夠做得更好但對當時而言則較為複雜。
在可視化1.0時代,Tesco走在行業前端,已經開始用地理可視化的方式做選址。用戶只需在其在線商城註冊賬號後輸入自己的地址,系統後台便會將用戶分配到他所屬的門店。但這對地理編碼的精度要求特別高,假設你的地址定位不準確就會影響後續的整個配送路徑。
在選址之前需對現有門店進行較深的認知,以麥當勞商圈調查為例,在選址之前需要對已經開業的門店做很多商業調研,將這些收集回來的數據呈現在地圖上,目的是幫助他們了解其客戶,這些客戶分布在哪裡?
上圖每一個格子代表客戶百分比,顏色越深就代表這個地方的客戶越多。可以發現,大部分客戶都來自於離店鋪越近的地方,越遠的地方它的顏色越淺。另外還可以發現這家店的商圈大小,商圈的範圍是80%的客戶所分布的範圍。通過調研的方式計算出80%的客戶分布哪些範圍以內?另外還能了解有哪些因素會影響到商圈的大小及形狀。比如在上圖的右下角為一個高等級道路,可以發現在道路上方集中了大部分客戶,而在道路下方並沒有很多客戶,那就說明高等級道路是影響商圈形狀的重要因素。通過這種方式還能得到其他認知,例如河流也是影響商圈形狀的一個因素。
再以樂天瑪特為例,他的需求是根據會員分布結合人口數據幫助其制定DM投放策略。例如人口多、會員較少的區域或是會員多、購買頻率較低的區域都是需要重點關注的地方,如上圖右上角圈出來的紅色區域,它就是DM投放重點關注的區域。
當我們有了會員數據之後,繼續把會員的消費金額、消費頻次投放到地圖之上,幫助他們安排接送車及站點分布。如在銷售額貢獻大的區域增加站點等。
在地理可視化1.0時代,阿迪達斯是一個較為特殊的案例。
一直到現在為止,收集商圈市場容量數據是較難的一件事情。但我們通過可以獲取到的POI數據模擬商圈的市場潛力以達到發現其市場容量的目的。對於某些大家熟悉的大城市如上海而言,所有人都能大致了解其核心商圈。但我們的最終目的是幫助商戶了解二三線城市,甚至是四線城市。當對這個城市不夠了解時,如何挑選品牌應該進入的區域?這就是阿迪達斯服務案例解決的問題。
2.0時代:分析與流程
2.0時代是如今大部分企業所處的一個階段。由於數據量急劇上升,我們需要針對這種大數據做分析,從1.0時代針對單個點解決具體問題,上升至2.0時代幫助企業建立流程進而處理選址過程中可能面臨的一些問題。
以上汽為例,在收集了新能源車輛的的行車軌跡數據後,提前制定好用戶標籤從而制定出用戶畫像,汽車廠商就會根據這些標籤找到一些異業聯盟。例如這一品牌的客戶經常會去某個購物中心,那麼就可將車放在這個購物中心供潛在的客戶試駕,這也就是一個潛在的獲取客戶的渠道。
再以JDPower所做的會員管理系統為例。根據客戶的到店頻次、消費金額以及最近到店消費時間,將會員劃分成不同等級,如高價值客戶、低價值客戶、高風險客戶、低風險客戶等,針對不同的客戶類型進行不同的營銷策略。在此平台基礎上,還可以交互地針對某一區域的客戶做營銷。通過對會員更深入的分析,幫助他們更好地制定一個選址策略。
以極海和某銀行的合作平台為例,對於現階段而言,增加網點並不是銀行主要的目的,而是通過系統的層次建立一個流程,對網點進評估,針對不同的網點從數據的角度制定開、停、並、轉的決策。
3.0時代:機器學習輔助決策
從去年開始就有很多企業慢慢在選址策略上應用機器學習的方式。這裡引入自然街區這一概念。
自然街區是規劃里的一個概念,將它應用到零售選址這一行業中代替原先的網格方式。網格方式最大的缺點在於網格可能會橫跨一條路、覆蓋了兩個小區,這樣就有可能出現一種分歧。假設一個小區是公寓,一個小區是別墅,那麼這兩個小區的人其實是沒有同質性可言的。為了解決這一問題,我們引入自然街區的方式。
沿街道、河流等天然屏障劃分的自然街區對此就具有天然優勢,因為各等級街道是人口的隔離和聚攏的自然表現,小巷衚衕可以把附近的人聚攏在一塊,高速路和主幹道卻把一塊地切割成比較獨立的活動區域,這種符合情理的劃分方式會為各種各樣的分析提供可靠性上的保障。
生成自然街區之後,將所有的數據基於這個統計單元做出分析。對每一個區塊做出區分,打上標籤,如辦公區、大學城、購物中心等。
不同的零售業態關注的類型是不一樣的,如高檔的化妝品關注購物中心,而像麥當勞、肯德基則更關注居民區、商業街等人流更為集中的地方。
在美國,數據的完整度是非常好的,他可以做到對每一個街區定一個類別,假設這個街區叫做Milk and Cookie,那在這個街區生活的人則是中產階級有孩子的家庭,這一家庭平均兩三個人住在獨棟的房子中。有了這樣的分析結果後,就能在選址的時候做出很明確的目標。
但是來到國內後發現數據沒有這麼好的完整度,這就意味著你很難說清每個街道住的人都是怎樣的檔次,其消費能力如何?因此我們的解決方案是將會員數據投放至自然街區上,每一個自然街區有相對應的會員數,會有各維度統計而來的數據,通過機器學習的方式了解哪些因素對它有正向作用,經過不斷的學習和迭代後,預測每塊區域中可能會帶來多少潛在會員。
這是在2016年我們給北京一個做房地產的房產中介公司推出的自動報告的工作平台。根據每個月更新的數據,機器會自動利用30多大類數據做400多項小指標的運算,生成一份一百多頁的PPT報告,而且整個過程就用一分鐘。我們把北京分成了兩千多個自然街區,在一分鐘之內就能同時出兩千份一百頁的PPT投策報告。我們希望跟房地產公司等各行業的客戶合作,通過這些新技術,把他們從以前不熟悉的技術工作中解脫出來。讓他們把自己更多的精力,投入到他們更擅長的專業里去,真正做到術業有專攻、共贏,提高他們的工作效率,也同時大大的促進他們的工作成果。
我們希望搭建一個一站式雲平台幫助用戶解決一些他們不需要關注的問題,如數據安全問題、服務問題、模型問題,在這個平台環境下,幫助用戶儘可能提供現成數據,在數據基礎上搭建常見應用,所有的數據和應用利用API、SDK的方式封裝起來,能夠在這個基礎上做一些更複雜的應用場景。
在平台上可以支持不同數據源、不同維度、不同格式的數據。另外公共數據也是非常重要的數據,目前極海團隊會定期更新和處理大量的數據。針對大數據如何做可視化這一問題,我們採用了雲端與前端相結合的方式,在後端對數據進行切片渲染,推送到前端進行可視化。
但現在企業自己內部的業務數據越來越多,外部的多源的數據獲取也越來越容易,價格越來越便宜。我們怎麼把這些多源的大數據進行整合,是否能真正有效的挖掘他們的價值?根據這些數據能否做出預測?這個是我們有了人工智慧才敢想的。很慶幸,我們極海的小夥伴們,對人工智慧的演算法很早就非常的痴迷。
我們高效整合了內外網豐富的位置數據、商業數據、政府公開數據,採用機器學習技術提高數據質量並生產更多獨有的數據。生產基於各種地理數據的深度學習模型,諸如交通分析、客源分析等大數據分析方法,通過這些數據和方法可以對街區中的用戶群進行精細分析,高效調查區域內數以萬計的用戶群。
這所有的數據和分析方法,都被封裝到一個數據容器內方便使用提取,這個容器,我們稱之為「城市基因」,猶如生物研究的DNA一般,幫助精細精準地描述城市,為解決店鋪選址,提供豐富、高質量的數據基礎。
基於城市基因,我們能夠輕鬆搭建面向行業應用的服務平台,如與IBM合作的平台 Metro Pulse。
這一階段的雲平台基本可以滿足到2.0需求,在未來會有更多的新技術加入這一平台。
編輯 | 王旭晶: wangxujing@dtcj.com
題圖 | 站酷海洛
▍數據俠門派
本文數據俠何宇兵,現任GeoHey極海上海分公司技術總監,曾就職Esri中國、麥當勞中國。具有豐富的GIS系統架構設計、分析和應用經驗。主要關注GIS在選址規劃、商業數據地理分析、物流優化等領域的應用。服務客戶包括百勝、麥當勞、星巴克、阿迪達斯、樂購、沃爾瑪、屈臣氏、工商銀行、交通銀行、國元保險、德邦、北汽、上汽等,幫助客戶通過地理的方式提升數據價值,輔助業務決策。
▍加入數據俠
「數據俠計劃」是由第一財經旗下DT財經發起的數據社群,包含數據俠專欄、數據俠實驗室系列活動和數據俠聯盟,旨在聚集大數據領域精英,共同挖掘數據價值。了解數據俠計劃詳情請回復「數據俠計劃」,投稿、合作請聯繫datahero@dtcj.com。
推薦閱讀:
※如何進行有效的大數據處理、分析?
※【市場調研】預測竹筍價格市場分析
※[英語句翻6-10]讓英語學習不再痛苦
※大數據必備知識:數據的分類方式
※零基礎學大數據 你需要的書籍和視頻教程