數據分析到底有多火-Excel分析實戰
07-18
數據分析到底有多火-Excel分析實戰
推薦閱讀:
來自專欄猴子聊數據分析7 人贊了文章
一、提出問題:
近幾年數據分析非常火,相關崗位需求逐年攀升。那麼我們除了從招聘信息數據去挖掘分析,是否還能從其他方面去佐證分析這一事實呢?以噹噹網路類圖書為數據源,在噹噹網路圖書分類中:
1、數據分析相關圖書佔比是怎樣的?
2、近幾年的數據變化是怎樣的?
3、近三年大家關注的領域是哪方面的?
二、理解數據:
- 數據採集:集搜客,噹噹網路類圖書前10頁。累計數據400條。
2、原始數據:
三、數據清洗:
經檢查,採集到數據比較完整,無缺失值和重複值。
1、調整列寬
2、刪除重複值
3、隱藏無用項
4、這裡查找書名及描述里含有「數據分析,數據處理,人工智慧,機器學習」字樣,來判斷書籍的相關性。
5、我們需要分析近幾年的數據,因此需要把出版時間中里的年份提取出來。
這裡用到MID函數。
6、因沒有銷量數據,所以我們暫以評論數據來代替銷量。同樣也需要把評論數據提取出來。
這裡用到LEFT函數。
7、因後邊需要做評論排序,而上述提取出來的數據類型為字元串型數字,所以需要對評論數據進一步處理。
以上,已完成了數據清洗部分的工作。接下來進入構建模型及可視化工作。
四、構建模型及可視化工作
- 建立數據透視表,以數據分析圖書為篩選項,以年份計數,分析數據分析類圖書的年度變化。
以上可以看到,2011-2018年間,共有68本數據分析圖書出版,佔比總網路類圖書17%。
其中2015-2016年,數據分析類圖書明顯激增,並在2016年到達峰值。2017-2018小幅回落。
2、近三年里,數據分析中哪類領域是大家比較關注的。
可以明顯看到,Python類圖書明顯佔優。大家對諸如Python編程熱度不減。
推薦閱讀:
※數據分析師該這樣霸氣回應「0.00008的轉化也很好」的謬論
※Community Preserving Network Embedding閱讀報告
※python 數據分析的基礎學習
※聚類分析中幾種演算法的比較
※數據思維---互聯網時代的必備能力