爬蟲請求頭各參數含義
-
Host
指定的請求資源的域名
-
User-Agant
瀏覽器代理
-
Accept
指定客戶端可以接受哪些類型的信息 -
Cookie
Cookie其實就是由服務器發給客戶端的特殊信息,而這些信息以文本文件的方式存放在客戶端,然后客戶端每次向服務器發送請求的時候都會帶上這些特殊的信息。 服務器在接收到
Cookie
以后,會驗證Cookie
的信息,以此來辨別用戶的身份。類似於通行證的東西 -
Cache-Control
指定請求和響應遵循的緩存機制。在請求消息或響應消息中設置Cache-Control並不會修改另一個消息消息處理過程中的緩存處理過程。請求時的緩存指令包括no-cache、no-store、man-age、max-stake、min-fresh、only-if-cached;響應消息中的指令包括 public、privete、no-cache、no-store、no-transform、must-revalidate、proxy-revalidate、max-age。
-
Referer
頁面跳轉處,表明產生請求的網頁來自於哪個URL,用戶是從該 Referer頁面訪問到當前請求的頁面。這個屬性可以用來跟蹤Web請求來自哪個頁面,是從什么網站來的。
-
Content-Length
內容長度。
-
Content-Range
響應的資源范圍。可以在每次請求中標記請求的資源范圍,在連接斷開重連時,客戶端只請求該資源未下載的部分,而不是重新請求整個資源,實現斷點續傳。迅雷就是基於這個原,使用多線程分段讀取網絡上的資源,最后再合並。
-
Accept-Encoding
指定客戶端可以接受的內容編碼
-
Accept-Language
指定客戶點可以接受的語言類型
-
Connection
客戶端與服務器鏈接類型,keep-alive:保持鏈接,close:關閉鏈接。
-
Upgrade-Insecure-Requests:1
該參數能使https請求調用http的資源; 如果沒有該參數,在訪問https的頁面時如果帶有http的資源,會報錯
-
- 鏈接轉自:https://blog.csdn.net/gklcsdn/article/details/101522169
-