HttpClient的userAgent和refer問題

本文轉載自查看原文 2019-08-08 17:59 891 Java

HttpClient本質是模擬瀏覽器去請求網址，獲取請求response。

為了更真實的模擬瀏覽器，不被限制，需要設置一些請求header。

如果是爬蟲的話，老慮的會更多些，爬取網站在HttpClient中設置Host,Referer,User-Agent,Connection,Cookie和爬取的頻率和入口Url等

比如：

httpGet.setHeader("User-Agent", "Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:50.0) Gecko/20100101 Firefox/50.0");
httpget.setHeader("Referer", "http://www.google.com");

但如果不加處理的話，比如使用HttpClient 4.3.2版本的請求網址，response中UA會獲取成Apache-HttpClient/4.3.2 (java 1.5)類似的結果，並且隨着httpclient版本的不同需略有不同

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 巧用UserAgent來解決瀏覽器的各種問題 pip install fake-useragent 裝不上問題巧用UserAgent來解決瀏覽器的各種問題 HttpClient DateUtils 的時區問題 HttpClient 設置超時問題 httpclient的並發連接問題 HttpClient的NoHttpResponse問題 fake-useragent插件無法正常使用的問題 English - refer to...和refer to...as Android的HttpClient和WebView session不同的問題