本文是Brightdata代理快速上手教程,Brightdata功能十分強大,但相對其他國內的代理服務商來說,對小白沒有那么容易上手。這里做一個從零到上手的教程。大家也可以參數官方更詳細的 文檔。
1、注冊賬號
首先需要注冊Brightdata的賬號, 還沒有注冊賬號的同學可以先到這里注冊Luminati的賬號,使用郵箱注冊即可。
2、開通代理隧道
注冊賬號后,到后台管理面板的【代理通道】菜單下,啟用適合自己場景的代理隧道,他有四種代理類型,如下圖:
可以點擊隧道前的編輯按鈕,編輯代理信息,如白名單等等。
3、安裝代理管理器
代理隧道需要配合代理管理器使用(LPM)。到管理面板的【代理管理器】菜單下,點擊【安裝一個新的代理管理器】:
然后選擇自己使用平台的安裝下載安裝:
4、使用代理管理器
安裝好代理管理器后,啟動代理管理器(這里以Windows平台為例),雙擊圖標啟動,在啟動后會在本機拉起一個代理管理服務,如下圖:
我這里的服務地址為 http://127.0.0.1:22999/
,在瀏覽器中打開會看到這樣的界面:
然后我們創建一個給爬蟲使用的代理隧道,點擊創建按鈕,選擇你在第二節中啟用的代理隧道,點擊下一步:
然后選擇代理類型,這里的類型有兩種,第一種是固定IP的場景,每次請求都是一個固定代理IP。第二種是動態IP,每次請求都會更換一個代理IP,這里我們選擇第二種, 點擊創建即完成:
創建完成后會在本機拉起一個指定端口的代理隧道,可以在隧道列表頁查看,記住這里的端口 24000
。注意這里的狀態需要是 OK
狀態。
以上就完成了一個代理隧道的創建,然后就可以在爬蟲中使用。
5、爬蟲使用
完成上述步驟后會在本機拉起一個特點端口的代理隧道服務,在本例中為: http(s)://127.0.0.1:24000
。
代碼使用示例:
import requests
requests.get("http://httpbin.org/ip", proxies={"http": "http://127.0.0.1:24000"}).json()
我們請求了五次,每次使用的代理都是不一樣的,而且都是高匿代理:
最后你也可以在代理服務頁查看使用情況,包括請求次數,成功率,使用流量等。
本教程到此結束,更多使用文檔請參考官網。