數據分析番外篇02_如何利用數據分析來選擇租住地

數據分析番外篇02_如何利用數據分析來選擇租住地

來自專欄數據分析

在北京上班,不僅工作壓力大,出行壓力也不小。為了能相對舒適經濟的上下班,覺得使用數據分析來決策我將住哪應該比較有意思。整體思路:評估模型建立,數據收集,數據分析,結果解讀。整個過程涉及到了地址選擇,交通出行方式評估,將通過兩篇短文來介紹。

首先介紹住址選擇:

設計評估模型

作為收入有限的工薪一族,本著能省絕不浪費,且不放棄居住舒適的原則(我是不是要求有點太高了?),不得已將選擇範圍放到了五環之外。初步意向有三個:大東北向,大西北向,老正北向。通過信息查詢,圈定了5個備選小區。問題來了,如何在這5個小區中做出抉擇,同事們和朋友們公說公有理,婆說婆有理,汗ing。有選擇控的我橫下一條心,自己的事情自己做,乾脆設計一個評估表,通過兩個維度來做個數據評估吧,同時自己在房屋租金和通勤時間這兩個維度上給設了一個底線(房屋租金3000以下,通勤時間不超2小時)。你們不要問我為啥是2小時這樣打擊人的問題,謝謝!

有了評估模型,管你黑中介還是白中介,你們誰都忽悠不了我了,自己的事情自己做,選錯了哭到眼瞎也要住它一年。

收集數據:

安利一個APP,某北京大型中介有個APP,買房,租房那是杠杠的, 親自體驗,其公布的數據還算靠譜,尤其在國家高壓政策下尤其准,不要問我為啥知道的。通過這個APP,租金數據迅速搞定。

通勤時間是個問題,北京的交通,開車?!用數據語言來說,方差大得讓你懷疑人生,20分鐘的路程隔三差五讓你走上2個小時。公共交通可能靠譜點,但是得有一副鋼筋鐵骨,畢竟宇宙曾經的中心和宇宙中心在北京(捂臉)。那就通過號稱已經具備了人工智慧某地圖查詢一下通勤時間吧。

兩個維度的數據都收集到了,結合自己的心裡底線,可以用設計的模型進行評估了,結果如下

上表採用兩居室的價格,能很好地體現不同小區的真實價格,且容易評估出單間主卧的價格

數據分析/解讀:

通過收集到的數據+心裡底線結合上表,可以看出:時間都不是問題,5個備選小區都在心理承受範圍內;

租金!租金!租金!看著那麼高的租金,作為北京的「民工」,心裡好痛,不想看到「大有庄」和「巨山路」這兩個小區,來人呀,幫我把它們從我眼前挪走吧。不是我放棄了你們,是收入選擇了無視你們。心裡暗暗下定決心,等我漲、漲、漲了工資,一定去「巨山路」租它一套住上一個月。(通過備註原因,大家應該也發現了,其實我還是做了很多線下工作的)

現在範圍縮小到了三個小區,可以投入一定的時間和精力實地探查一下了。

還是讓我們設計一個評估模型來確定時間和精力的投向吧!

設計評估模型:

錢依舊是重點,誰讓公司領導給俺的薪水辣么少(哭)。房租,交通費,飯??算了飯還是自帶吧。通勤時間,通勤方式,生活便利,居住舒適都是我要追求的。看看上表,那是一個北京「民工」的夢想,只不過這次評估表單中的維度(屬性)變成了行向量,畢竟這樣好排版點。

收集數據

為了夢想早日實現,周六日就得努力工作。 只有現場探查後,才深深感受到,以後不能讓備選小區各自離太遠,周六日就一個周六,一個周日。為了評估夢想,居然得浪費兩個周六日才能採集到評估數據。容易莫我,真不容易呀(汗)

現場探查小區生活狀況,並實乘地鐵計算通勤時間

數據分析:

評估夢想的數據收集到了,應該怎麼評估呢? 這表單里有數值型數據,有屬性型數據,總費用還跟租金和通勤費用有相關性,這評估表單是我設計的嗎?自己設計的表單,自己分析,只能自己救自己了。使用歸一大法了吧,科學嚴密的歸一做不到,我主觀的歸一一下總歸是極好的。加個權重,全憑自己的感受在主觀打分吧!

結果解讀:

畢竟總費用在數據上與租金和通勤費多重共線,還是拿掉吧(捂臉),原諒關心消費的我如此關注費用吧。看到上表那個綠色的框框了沒有?

經過千辛萬苦,恩,我選擇租住在那裡了,租金便宜,交通還算方便,居住也能接受。千萬不要問我那些分是怎麼來的,總分是怎麼算的,又不是你的老師,我是不會教你的。

打完收工,改天再來!


推薦閱讀:

15分鐘入門Gensim
大話機器學習之窮人如何玩轉數據挖掘
《Python數據挖掘》筆記(七) 自動化文本摘要
數據缺失值的4種處理方法
SubCAM37插值後分別對xy做歸一化

TAG:數據分析 | 數據挖掘 | 實踐 |