數據挖掘與可視化分析——以武漢市房價為例

近兩年來,以北京、上海、深圳等一線城市為代表的房價暴漲,部分二線城市如南京、武漢等地漲幅也非常大。本文旨在利用網路爬蟲爬取鏈家房天下安居客等3家主流網站的數據,建立多種機器學習回歸模型,嘗試對武漢市房價進行簡要分析與預測。鑒於影響房價漲跌的因素非常多,如此複雜的特徵工程是一個巨大的挑戰。再加上朝廷對房價的漲跌起著決定性的作用,因此要想建立完善的機器學習模型用於房價的精準預測幾乎是不可能完成的任務。但是可作為一定的參考。利用訓練集數據訓練的模型,在測試集上能達到比較可觀的效果。

代碼與數據已開源,感興趣的童鞋歡迎到github提issue。對技術不感興趣的童鞋就直接看圖吧~

溫馨提示:點擊圖片翻頁閱讀體驗更好哦~

歡迎對 機器學習/數據挖掘 方向感興趣的小夥伴們多多交流,對於分析報告中可能存在的錯誤與不足,歡迎提出補充意見。^_^
推薦閱讀:

TAG:爬蟲計算機網路 | 數據分析 | 數據挖掘 |