python爬蟲庫里的get請求是怎麼實現的?

如果想寫出來,需要掌握什麼樣的知識呢?


如果只是模擬一個get請求還是挺容易的。

import socket

data = b"GET /get HTTP/1.1
Host: httpbin.org
Connection: keep-alive
Accept-Encoding: gzip, deflate
Accept: */*
User-Agent: python-socket

"
url = "httpbin.org"

s = socket.socket()
s.connect((url, 80))
s.sendall(data)
print(s.recv(999))


爬蟲庫嘛 就是封裝的http協議
而http協議就是封裝的TCP協議
你需要去看 圖靈社區 : 圖書 : HTTP權威指南

單論get請求的話就是就是用socket 向一個ip地址發一個字元串這個字元串的格式是


推薦閱讀:

作為一個程序員,至少需要掌握哪幾種編程語言?
什麼筆記本電腦適合學習編程的窮學生學習?
為什麼程序員薪水這麼高?很多工業比如石油能源等行業薪水都偏低?
當應用程序調用Send之後怎麼判斷對方是否成功接收?
上萬元的人體工學椅到底好在哪?

TAG:程序員 | Python | 爬蟲計算機網路 |