Python數據分析之簡書七日熱門數據分析
01-25
之前爬了一些數據,沒有做分析,今天在練習jupyter notebook的使用,乾脆拿了2月七號爬取的七日熱門數據來進行簡單的分析,主要運用了mongodb的pipeline管道等技術加上charts包的使用。
七日熱門的文章發布日期
第一次看了下效果,感覺是標題黨(說好的七日熱門呢),可能是因為有些文章太好,以至於一直存留吧,然後對超過七天的文章進行剔除。
每天的收錄數量都很平均,2月6號偏少的原因可能是來不及統計(我是2月7號爬蟲)。再看看發布的具體時間:
文章大數為下午,晚上所寫。大部分為上班原因。(其實很佩服那些白天上班,晚上還給大家分析學習的人)。
排名
先看看熱評文章的作者:
以此類推,也可以分析出打賞最多等統計數據。最後看看綜合排名最高的文章(評論,瀏覽,打賞和喜歡):
最後一擊!2016年Mac 系列裡我認為最值得推薦軟體
學霸的筆記,教育的失敗?春節這幾天,我看的7部電影
曾經有人和我道晚安春晚小品不好笑我可以忍,但大過年出來噁心人就不對了簡年14:暗戀真的是一個人的事嗎?非功利性英語學習工具推薦(iOS版本)三分鐘即席演講與月入10W+,這才是你要學會的本領
我是如何從土肥圓逆襲成為白富美的?嫁給窮男人不幸福?我就是那個坐在自行車上笑的女人
看來大家都喜歡看一些舒緩的文章(我已哭暈在廁所)。
作者:羅羅攀 Python愛好者社區專欄作者,請勿轉載,謝謝。
簡書主頁:羅羅攀 - 簡書
博客專欄:羅羅攀的博客配套視頻教程:Python3爬蟲三大案例實戰分享:貓眼電影、今日頭條街拍美圖、淘寶美食 Python3爬蟲三大案例實戰分享 公眾號:Python愛好者社區(微信ID:python_shequ),關注,查看更多連載內容。
推薦閱讀:
※Matplotlib 蠟燭圖教程
※WebGL Earth颱風監測web應用
※有誰可以說說「燈光遙感」?
※Python · cv2(零)