1. UserAgent 模塊使用
from fake_useragent import UserAgent
ua = UserAgent() # 實例化,實例化時需要聯網但是網站不太穩定
print(ua.ie) # 隨機打印一個 ie 瀏覽器的頭
print(ua.random) # 隨機打印 User-Agent
2. 模塊下載
pip install fake-useragent
3. 查看 fake-useragent 模塊下載 User-Agent 的下載地址
下載地址:
http://d2g6u4gh6d9rq0.cloudfront.net/browsers/fake_useragent_0.1.10.json
最后的 fake_useragent_0.1.10.json 中的 0.1.10 指的是版本
查看版本
https://pypi.org/project/fake-useragent/
// 也是模塊,文檔
4. 查看 fake-useragent 模塊下載 User-Agent 的下載地址
下載地址:
http://d2g6u4gh6d9rq0.cloudfront.net/browsers/fake_useragent_0.1.10.json
最后的 fake_useragent_0.1.10.json 中的 0.1.10 指的是版本
查看版本
https://pypi.org/project/fake-useragent/
// 也是模塊,文檔
如何查看:
F:\pyenv\pa_chong_env\Lib\site-packages\fake_useragent\settings.py
就在 模塊的 fake_useragent 的配置文件settings.py 文件中
5. 將User-Agent 全部下載
5.1. 下載
import requests
url = "http://d2g6u4gh6d9rq0.cloudfront.net/browsers/fake_useragent_0.1.10.json"
response = requests.get(url)
with open("user_agent.json", 'w') as fp:
fp.write(response.text)
5.2. 封裝一個隨機類
從文件中篩選出指定的值
import json
import random
class User_Agent(object):
"""
直接將 網頁的源碼復制下載之后, 可以使用此類進行解析
self.user_agent_data 是 讀取 文件的,
"""
def __init__(self, json_file="user_agent.json"):
"""
:param json_file: 下載后內容保存的文件
"""
self.json_file = json_file
self.ua_data = self.user_agent_data().get("browsers")
self.b = ['chrome', 'opera', 'firefox', 'safari', 'internetexplorer']
# -------
self.chrome = lambda: random.choice(self.ua_data.get("chrome"))
self.opera = lambda: random.choice(self.ua_data.get("opera"))
self.firefox = lambda: random.choice(self.ua_data.get("firefox"))
self.safari = lambda: random.choice(self.ua_data.get("safari"))
self.ie = lambda: random.choice(self.ua_data.get("internetexplorer"))
self.random = lambda: random.choice(self.ua_data.get(random.choice(self.b)))
def user_agent_data(self):
with open(self.json_file, "r") as fp:
data = fp.read()
return json.loads(data)
ua = User_Agent()
for i in range(10):
print(ua.random())