Python數據科學-技術詳解與商業實踐-第九講作業
08-20
Python數據科學-技術詳解與商業實踐-第九講作業
來自專欄程序猿數據愛好者4 人贊了文章
作者:Ben,著有《Python數據科學:技術詳解與商業實踐》、《用商業案例學R語言數據挖掘》、《胸有成竹-數據分析的SAS EG進階》作者。2005年進入數據科學領域,先後在亞信、德勤、百度等企業從事電信、金融行業數據挖掘工作。專註於消費信貸和財富管理方面的數據治理、客戶智能與風險智能領域。
配套視頻教程:Python數據科學-技術詳解與商業實踐(第二期)課程鏈接: https://edu.hellobi.com/course/280
涉及內容:電信客戶消費行為聚類-變數主題相關性分析、信息壓縮、分布形式轉換與客戶分群描述
1、背景介紹:
使用電信公司的客戶業務使用量數據進行客戶細分,數據集為profile_telecom.csv,首先通過因子分析,進行降維。之後進行客戶消費習慣分群,並使用決策樹進行客戶分群輪廓畫像。
2、本案例涉及的變數說明如下:
cnt_call 打電話次數
cnt_msg 發簡訊次數
cnt_wei 打開微信次數
cnt_web 登陸網頁次數
3、作業安排:
3.1 基礎知識:
1)分析K-means和層次聚類的適用情況。
3.2 案例解答步驟如下:
1)通過因子分析,進行降維。
2)使用kmeans進行客戶消費習慣分群。
3)使用決策樹進行客戶分群輪廓畫像
推薦閱讀:
※numpy.random.seed和Sklearn中RandomState的解析
※如何擴充你的數據科學工具包?這裡有24款免費的數據科學工具!
※深入淺出學習大數據:探討大數據系統基準以及科學問題!
※邁向職業的第一步:24個終極數據科學項目
※跨行之痛