爬蟲怎麼解決封IP的問題?

目標網站國內,每天爬取量較大,大約在300萬左右的量,

目前1秒3次成功抓取即可,因為我們是在開多線程

現在發現ip被封的概率非常大

企業用,可付費購買IP(3000左右/月)、找不到有效的IP使用,求各位援手給指個方向 叩謝


這個要創建一個ip代理池,定時檢測,保證能用的匿名代理。

1、可以從代理網站上抓取

2、也可以自己掃描

3、也可以購買。

4、購買雲主機,可以有一些ip。

5、可以定期斷網,更改ip。

.........................


爬蟲訪問中,如何解決網站限制IP的問題?

這個連接回答的比較全


我們做的雖然不是爬蟲,但是用到換IP,買個幾個伺服器,建了個IP池,每隔幾分鐘重新撥號下


搜索下代理IP池,找幾家試用下,選個相對靠譜的用。或者自己搭一個,Github上有開源的。


推薦閱讀:

爬蟲用哪個好?
python 中文url 編碼如何轉換回中文?
爬蟲工程師的未來方向在哪?
如何抓取etymonline的詞根與解釋?
網路技術不斷進步,我們還有隱私么?

TAG:Python | 爬蟲計算機網路 | 自動代理配置PAC | Http代理 | python爬蟲 |