python爬蟲庫里的get請求是怎麼實現的?
12-28
如果想寫出來,需要掌握什麼樣的知識呢?
如果只是模擬一個get請求還是挺容易的。
import socket
data = b"GET /get HTTP/1.1
Host: httpbin.org
Connection: keep-alive
Accept-Encoding: gzip, deflate
Accept: */*
User-Agent: python-socket
"
url = "httpbin.org"
s = socket.socket()
s.connect((url, 80))
s.sendall(data)
print(s.recv(999))
爬蟲庫嘛 就是封裝的http協議
而http協議就是封裝的TCP協議
你需要去看 圖靈社區 : 圖書 : HTTP權威指南
單論get請求的話就是就是用socket 向一個ip地址發一個字元串這個字元串的格式是
推薦閱讀:
※作為一個程序員,至少需要掌握哪幾種編程語言?
※什麼筆記本電腦適合學習編程的窮學生學習?
※為什麼程序員薪水這麼高?很多工業比如石油能源等行業薪水都偏低?
※當應用程序調用Send之後怎麼判斷對方是否成功接收?
※上萬元的人體工學椅到底好在哪?