1. UserAgent 模块使用
from fake_useragent import UserAgent ua = UserAgent() # 实例化,实例化时需要联网但是网站不太稳定 print(ua.ie) # 随机打印一个 ie 浏览器的头 print(ua.random) # 随机打印 User-Agent
pip install fake-useragent
下载地址: http://d2g6u4gh6d9rq0.cloudfront.net/browsers/fake_useragent_0.1.10.json 最后的 fake_useragent_0.1.10.json 中的 0.1.10 指的是版本 查看版本 https://pypi.org/project/fake-useragent/ // 也是模块,文档
下载地址: http://d2g6u4gh6d9rq0.cloudfront.net/browsers/fake_useragent_0.1.10.json 最后的 fake_useragent_0.1.10.json 中的 0.1.10 指的是版本 查看版本 https://pypi.org/project/fake-useragent/ // 也是模块,文档
F:\pyenv\pa_chong_env\Lib\site-packages\fake_useragent\settings.py
5.1. 下载
import requests url = "http://d2g6u4gh6d9rq0.cloudfront.net/browsers/fake_useragent_0.1.10.json" response = requests.get(url) with open("user_agent.json", 'w') as fp: fp.write(response.text)
5.2. 封装一个随机类
import json import random class User_Agent(object): """ 直接将 网页的源码复制下载之后, 可以使用此类进行解析 self.user_agent_data 是 读取 文件的, """ def __init__(self, json_file="user_agent.json"): """ :param json_file: 下载后内容保存的文件 """ self.json_file = json_file self.ua_data = self.user_agent_data().get("browsers") self.b = ['chrome', 'opera', 'firefox', 'safari', 'internetexplorer'] # ------- self.chrome = lambda: random.choice(self.ua_data.get("chrome")) self.opera = lambda: random.choice(self.ua_data.get("opera")) self.firefox = lambda: random.choice(self.ua_data.get("firefox")) self.safari = lambda: random.choice(self.ua_data.get("safari")) self.ie = lambda: random.choice(self.ua_data.get("internetexplorer")) self.random = lambda: random.choice(self.ua_data.get(random.choice(self.b))) def user_agent_data(self): with open(self.json_file, "r") as fp: data = fp.read() return json.loads(data) ua = User_Agent() for i in range(10): print(ua.random())