python 爬蟲之requests模塊設置代理


 

文章目錄
為什么設置代理?
設置代理
常用獲取代理IP地址
測試IP地址可用性
為什么設置代理?
我們都知道上網連接到互聯網時會有一個【ip】地址。

而網站都有請求的臨界點,當我們對一個網站發起多次請求時,網站發現請求次數超過了臨界點,就會自動屏蔽掉我們的【ip】,這時就再也無法訪問此網站了。

這就是基礎的一種反爬技術

對於這種情況,解決方案也其實很簡單:只需在請求時通過設置代理【ip】的方式,就可以解決啦。

在【requests】請求時,可以非常便捷的替換發給服務端的【ip】地址,這樣網站面對多個不同的【ip】地址,就沒有辦法屏蔽。

設置代理
使用proxies方法傳入字典格式的IP地址即可初步設置代理

import requests
url = 'https://www.shiguangkey.com'
proxies = {'http':'http://192.186.72.6:8000'}# ip地址
# 通過proxies參數傳入ip
response = requests.get(url, proxies=proxies)
1
2
3
4
5
需要注意如果你用這個http去直接請求百度網址,其實用的不是代理的,是你自己的ip

這里要區別http和https,請求的網址前面帶s你的代理ip也要是帶s的才行


常用獲取代理IP地址
網上可以找到免費的IP地址,但是免費的終究有些問題,比如很多會發現無法使用

⻄刺免費代理IP:http://www.xicidaili.com/
快代理:http://www.kuaidaili.com/
代理雲:http://www.dailiyun.com/

測試IP地址可用性
這個網站可以測試簡單的HTTP測試網頁,我們可以用它來測試IP
http://www.httpbin.org/

我們在這個網址后加ip


發現網頁會變成如下,我們的IP地址,那么我們如何做呢

如果IP地址不可用,則:
會出現這種錯誤
————————————————
版權聲明:本文為CSDN博主「碼農一號已就位」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/xdc1812547560/article/details/108112913

在這里插入圖片描述

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM