前言:在使用selenium库爬取网站时,有个很常见到的问题,你使用的cookie无法登录网站,OK,废话不多说,解决问题
一、获取cookie
代码如下:
from selenium import webdriver
import time #设置时间延迟
browser = webdriver.Chrome()
import json
def get_cookies():
browser.get("https://fofa.so/")
browser.delete_all_cookies() #删除所有cookies
time.sleep(40) #延时40s,方便输入账号密码
cookies = browser.get_cookies() #获取cookie,以字典方式返回
with open("cookies.txt", "w") as f:
f.write(json.dumps(cookies)) #json.dumps:将字典变成字符串
f.close()
get_cookies()
存放cookie的文本文件

二、 使用cookie
代码如下:
from selenium import webdriver
import time #设置时间延迟
browser = webdriver.Chrome()
import json
def get_cookies():
browser.get("https://fofa.so/")
browser.delete_all_cookies() #删除所有cookies
with open("cookies.txt","r") as f:
cookies = json.load(f) #将文件字符串转换成python对象
for cookie in cookies:
browser.add_cookie(cookie) #添加cookie
get_cookies()