用python爬取絕地求生各區服top100玩家數據
想知道自己的rating分數離top100還有多少差距嗎?
要想上各個區服的排行榜,想知道自己目前最需要提高的數據的什麼嗎?是選擇練習槍法提高殺人數,還是練習LYB的技巧苟進前10再說?
哪個服排行榜的掛逼最多?那我們就不去那個服跟神仙剛!
如果要讓自己榜上有名,選擇哪個服作為沖分的目標最容易進top100?
各大俱樂部都在急招絕地求生的選手,IG最近還在重組戰隊,怎麼在芸芸孤兒的排行榜上通過數據分析迅速發現真正的吃雞大神?
本文介紹了如何用python3爬取絕地求生各區服排行榜top100的玩家數據,包括KD,場均擊殺數,場均存活時間,爆頭率等共計51項官方統計的數據(實時更新)
先放上github地址,歡迎fork,持續更新更優化的代碼:
xiaoliangliang/pubg_top100
環境準備
- python3
- selenium庫
- pandas庫
- 下載最新版的Chrome瀏覽器
- re正則表達式庫
參數設置(在pubg1.py的代碼里修改)
默認是歐服&solo模式&2018第一賽季的參數:
#模式參數&區服參數
mode = 1
region = 2mode1 = solo
region1 = eu#正則表達式pattern參數
pattern_solo = re.compile({"Region":"eu","Season":"2018-01","Match":"solo","Stats":(.*?)}]},re.S)>
這裡可以選擇不同的模式&區服,如果要改成亞服&雙排模式的top100數據:
#模式參數&區服參數
mode = 2
region = 3mode1 = duoregion1 = as
#正則表達式pattern參數
pattern_solo = re.compile({"Region":"as","Season":"2018-01","Match":"duo","Stats":(.*?)}]},re.S)
運行爬蟲程序
- cmd進入命令行
- cd到該文件夾目錄下
- python pubg1.py(該版本為最穩定版本,但是速度一般。。)
代碼優化思路(pubg2.py是測試版本,不穩定)
- 用PhantomJS代替Chrome瀏覽器
- 加入多線程爬取
爬取之後用pandas進行數據預處理的結果:
有了數據之後就可以做很多有趣的分析啦~
未來會有陸續更新關於絕地求生這款遊戲的數據分析文章~歡迎關注本人的兩個遊戲數據分析專欄:
電子競技比賽與數據分析吃雞專業隊——絕地求生賽事復盤推薦閱讀:
※python爬取廖雪峰教程存為PDF
※Python迅速爬蟲技巧
※為什麼網上Python爬蟲教程這麼多,但是做爬蟲的這麼少呢?爬蟲發展又該是如何呢?
※Python3爬蟲(3)單網頁簡單爬取文字信息
TAG:绝地求生:大逃杀游戏 | 数据分析 | python爬虫 |