數據分析到底有多火-Excel分析實戰

數據分析到底有多火-Excel分析實戰

來自專欄猴子聊數據分析7 人贊了文章

一、提出問題:

近幾年數據分析非常火,相關崗位需求逐年攀升。那麼我們除了從招聘信息數據去挖掘分析,是否還能從其他方面去佐證分析這一事實呢?

以噹噹網路類圖書為數據源,在噹噹網路圖書分類中:

1、數據分析相關圖書佔比是怎樣的?

2、近幾年的數據變化是怎樣的?

3、近三年大家關注的領域是哪方面的?

二、理解數據:

  1. 數據採集:集搜客,噹噹網路類圖書前10頁。累計數據400條。

2、原始數據:

三、數據清洗:

經檢查,採集到數據比較完整,無缺失值和重複值。

1、調整列寬

2、刪除重複值

3、隱藏無用項

4、這裡查找書名及描述里含有「數據分析,數據處理,人工智慧,機器學習」字樣,來判斷書籍的相關性。

5、我們需要分析近幾年的數據,因此需要把出版時間中里的年份提取出來。

這裡用到MID函數。

6、因沒有銷量數據,所以我們暫以評論數據來代替銷量。同樣也需要把評論數據提取出來。

這裡用到LEFT函數。

7、因後邊需要做評論排序,而上述提取出來的數據類型為字元串型數字,所以需要對評論數據進一步處理。

以上,已完成了數據清洗部分的工作。接下來進入構建模型及可視化工作。

四、構建模型及可視化工作

  1. 建立數據透視表,以數據分析圖書為篩選項,以年份計數,分析數據分析類圖書的年度變化。

以上可以看到,2011-2018年間,共有68本數據分析圖書出版,佔比總網路類圖書17%。

其中2015-2016年,數據分析類圖書明顯激增,並在2016年到達峰值。2017-2018小幅回落。

2、近三年里,數據分析中哪類領域是大家比較關注的。

可以明顯看到,Python類圖書明顯佔優。大家對諸如Python編程熱度不減。


推薦閱讀:

數據分析師該這樣霸氣回應「0.00008的轉化也很好」的謬論
Community Preserving Network Embedding閱讀報告
python 數據分析的基礎學習
聚類分析中幾種演算法的比較
數據思維---互聯網時代的必備能力

TAG:數據挖掘 | 數據分析師 |