Python數據分析之簡書七日熱門數據分析

之前爬了一些數據,沒有做分析,今天在練習jupyter notebook的使用,乾脆拿了2月七號爬取的七日熱門數據來進行簡單的分析,主要運用了mongodb的pipeline管道等技術加上charts包的使用。

七日熱門的文章發布日期

第一次看了下效果,感覺是標題黨(說好的七日熱門呢),可能是因為有些文章太好,以至於一直存留吧,然後對超過七天的文章進行剔除。

每天的收錄數量都很平均,2月6號偏少的原因可能是來不及統計(我是2月7號爬蟲)。再看看發布的具體時間:

文章大數為下午,晚上所寫。大部分為上班原因。(其實很佩服那些白天上班,晚上還給大家分析學習的人)。

排名

先看看熱評文章的作者:

以此類推,也可以分析出打賞最多等統計數據。最後看看綜合排名最高的文章(評論,瀏覽,打賞和喜歡):

最後一擊!2016年Mac 系列裡我認為最值得推薦軟體

學霸的筆記,教育的失敗?

春節這幾天,我看的7部電影

曾經有人和我道晚安

春晚小品不好笑我可以忍,但大過年出來噁心人就不對了

簡年14:暗戀真的是一個人的事嗎?

非功利性英語學習工具推薦(iOS版本)

三分鐘即席演講與月入10W+,這才是你要學會的本領

我是如何從土肥圓逆襲成為白富美的?

嫁給窮男人不幸福?我就是那個坐在自行車上笑的女人

看來大家都喜歡看一些舒緩的文章(我已哭暈在廁所)。

作者:羅羅攀 Python愛好者社區專欄作者,請勿轉載,謝謝。

簡書主頁:羅羅攀 - 簡書

博客專欄:羅羅攀的博客

配套視頻教程:Python3爬蟲三大案例實戰分享:貓眼電影、今日頭條街拍美圖、淘寶美食 Python3爬蟲三大案例實戰分享

公眾號:Python愛好者社區(微信ID:python_shequ),關注,查看更多連載內容。

推薦閱讀:

Matplotlib 蠟燭圖教程
WebGL Earth颱風監測web應用
有誰可以說說「燈光遙感」?
Python · cv2(零)

TAG:Python | 数据分析 | 可视化 |