用python爬取絕地求生各區服top100玩家數據

想知道自己的rating分數離top100還有多少差距嗎?

要想上各個區服的排行榜,想知道自己目前最需要提高的數據的什麼嗎?是選擇練習槍法提高殺人數,還是練習LYB的技巧苟進前10再說?

哪個服排行榜的掛逼最多?那我們就不去那個服跟神仙剛!

如果要讓自己榜上有名,選擇哪個服作為沖分的目標最容易進top100?

各大俱樂部都在急招絕地求生的選手,IG最近還在重組戰隊,怎麼在芸芸孤兒的排行榜上通過數據分析迅速發現真正的吃雞大神?

本文介紹了如何用python3爬取絕地求生各區服排行榜top100的玩家數據,包括KD,場均擊殺數,場均存活時間,爆頭率等共計51項官方統計的數據(實時更新)

先放上github地址,歡迎fork,持續更新更優化的代碼:

xiaoliangliang/pubg_top100

環境準備

  1. python3
  2. selenium庫
  3. pandas庫
  4. 下載最新版的Chrome瀏覽器
  5. re正則表達式庫

參數設置(在pubg1.py的代碼里修改)

默認是歐服&solo模式&2018第一賽季的參數:

#模式參數&區服參數

mode = 1

region = 2

mode1 = solo

region1 = eu

#正則表達式pattern參數

pattern_solo = re.compile({"Region":"eu","Season":"2018-01","Match":"solo","Stats":(.*?)}]},re.S)>

這裡可以選擇不同的模式&區服,如果要改成亞服&雙排模式的top100數據:

#模式參數&區服參數

mode = 2

region = 3

mode1 = duo

region1 = as

#正則表達式pattern參數

pattern_solo = re.compile({"Region":"as","Season":"2018-01","Match":"duo","Stats":(.*?)}]},re.S)

運行爬蟲程序

  1. cmd進入命令行
  2. cd到該文件夾目錄下
  3. python pubg1.py(該版本為最穩定版本,但是速度一般。。)

代碼優化思路(pubg2.py是測試版本,不穩定)

  1. 用PhantomJS代替Chrome瀏覽器
  2. 加入多線程爬取

爬取之後用pandas進行數據預處理的結果:

有了數據之後就可以做很多有趣的分析啦~

未來會有陸續更新關於絕地求生這款遊戲的數據分析文章~歡迎關注本人的兩個遊戲數據分析專欄:

電子競技比賽與數據分析zhuanlan.zhihu.com圖標吃雞專業隊——絕地求生賽事復盤zhuanlan.zhihu.com圖標
推薦閱讀:

python爬取廖雪峰教程存為PDF
Python迅速爬蟲技巧
為什麼網上Python爬蟲教程這麼多,但是做爬蟲的這麼少呢?爬蟲發展又該是如何呢?
Python3爬蟲(3)單網頁簡單爬取文字信息

TAG:绝地求生:大逃杀游戏 | 数据分析 | python爬虫 |