對Python話題下優秀回答者的整理
02-04
Hi,上一次萌新整理的一份大佬名單不知你是否看過,傳送門知乎上值得關注的Python大佬
這份名單都是個人意願,所以並不怎麼準確。
這一次,萌新用數據說話。
目標分析
1、抓取知乎「Python」話題下,精華回答下的回答者
2、加上Python所有子級話題下的優秀回答者
3、拿到追蹤的名單,對所有回答者的回答數量做一個排序
工具實現
在這裡並不想重新去寫一個爬蟲,使用的是一個數據採集工具——造數 - 新一代智能雲爬蟲
(記得加上Cookie)
如果你想寫的話,考慮下反爬就夠了,結構非常簡單,這裡有輪子 xchaoinfo/fuck-login
結果展示
最終拿到1722個用戶
說明:
- 匿名用戶沒有抓取
- 某些問題會被劃分到多個話題下
看看分析後的結果
來,排個序
- 黃哥 14
- 靈劍 13
- Coldwings12
- 董偉明 9
- 依雲 9
- vczh 8
- 賴勇浩 8
- Felis sapiens 7
- RednaxelaFX7
- xlzd7
- 段小草 7
- 劉鑫 7
- 劉志軍 7
- [已重置] 6
- Twisted Python 6
- 代霸天 6
- 勞里林 6
- 理想 6
- 劉奕聰 6
- 路人甲 6
- 羅伊 6
- 洛克 6
- 楊學光 6
- Adieu5
- Crossin5
- gashero5
- yegle5
- 編號89757 5
- 馮昱堯 5
- 郭寬 5
想要完整的數據,來公眾號「萌新的學習日記」,回復「名單」下載
其實最後看到這些數據也是挺有意思,[已重置]已經有6個優秀回答,這個賬號可是歷史悠久。
Python下有22個子級話題,有些話題下基本沒有回答,有興趣的可以研究下 Python
萌新整理很辛苦,喜歡的話能否點個贊
推薦閱讀:
※從零開始寫Python爬蟲 --- 2.2 Scrapy 選擇器和基本使用
※06.Pawn Brotherhood
※flowpy添加switch語句支持
TAG:Python |