python爬虫使用requests请求无法获取网页元素时终极解决方案

本文转载自查看原文 2020-06-14 19:28 4903

　　　　爬取数据时，有时候会出现无法通过正常的requests请求获取网页内容，导致数据无法抓取到，遇到这种情况时，可以换种思路去爬取数据，使用PhantomJS，即爬虫终极解决方案去获取页面元素。

#!/usr/local/bin/python3.7

from selenium import webdriver
import time

# phantomJS路径
path = '/Users/mozili/Documents/PhantomJS/phantomjs-2.1.1-macosx/bin/phantomjs'
# 创建浏览器对象
browser = webdriver.PhantomJS(path)

# 打开百度并操作
url = 'https://www.baidu.com'
browser.get(url)
time.sleep(1)
# 截图
browser.save_screenshot('Reptile/phantomjs_img/baidu.png')
# 定位搜索框
search = browser.find_element_by_id('kw')
time.sleep(1)
# 在搜索框输入内容
search.send_keys('美女')
time.sleep(1)
# 截图
browser.save_screenshot('Reptile/phantomjs_img/meinv.png')
# 关闭浏览器
browser.quit()

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 python爬虫之网页的获取requests的使用 Loguru：Python 日志终极解决方案 Java获取时间与系统时间相差8小时终极解决方案 Java获取时间与系统时间相差8小时终极解决方案 Chrome保存整个网页为图片(终极解决方案!) Mac无法清倒废纸篓,终极解决方案 Python中英文对齐终极解决方案 Python 爬虫 - requests、在 Linux 中使用 curl 命令访问网页 EF(EntityFramework)与mysql使用，错误终极解决方案 Python爬虫(八)_Requests的使用