Python數據科學-技術詳解與商業實踐-第九講作業

Python數據科學-技術詳解與商業實踐-第九講作業

來自專欄程序猿數據愛好者4 人贊了文章

作者:Ben,著有《Python數據科學:技術詳解與商業實踐》、《用商業案例學R語言數據挖掘》、《胸有成竹-數據分析的SAS EG進階》作者。2005年進入數據科學領域,先後在亞信、德勤、百度等企業從事電信、金融行業數據挖掘工作。專註於消費信貸和財富管理方面的數據治理、客戶智能與風險智能領域。

配套視頻教程:Python數據科學-技術詳解與商業實踐(第二期)課程鏈接: edu.hellobi.com/course/

涉及內容:電信客戶消費行為聚類-變數主題相關性分析、信息壓縮、分布形式轉換與客戶分群描述

1、背景介紹:

使用電信公司的客戶業務使用量數據進行客戶細分,數據集為profile_telecom.csv,首先通過因子分析,進行降維。之後進行客戶消費習慣分群,並使用決策樹進行客戶分群輪廓畫像。

2、本案例涉及的變數說明如下:

cnt_call 打電話次數

cnt_msg 發簡訊次數

cnt_wei 打開微信次數

cnt_web 登陸網頁次數

3、作業安排:

3.1 基礎知識:

1)分析K-means和層次聚類的適用情況。

3.2 案例解答步驟如下:

1)通過因子分析,進行降維。

2)使用kmeans進行客戶消費習慣分群。

3)使用決策樹進行客戶分群輪廓畫像

推薦閱讀:

numpy.random.seed和Sklearn中RandomState的解析
如何擴充你的數據科學工具包?這裡有24款免費的數據科學工具!
深入淺出學習大數據:探討大數據系統基準以及科學問題!
邁向職業的第一步:24個終極數據科學項目
跨行之痛

TAG:數據分析 | Python | 數據科學 |