python爬蟲使用requests請求無法獲取網頁元素時終極解決方案

本文轉載自查看原文 2020-06-14 19:28 4903

　　　　爬取數據時，有時候會出現無法通過正常的requests請求獲取網頁內容，導致數據無法抓取到，遇到這種情況時，可以換種思路去爬取數據，使用PhantomJS，即爬蟲終極解決方案去獲取頁面元素。

#!/usr/local/bin/python3.7

from selenium import webdriver
import time

# phantomJS路徑
path = '/Users/mozili/Documents/PhantomJS/phantomjs-2.1.1-macosx/bin/phantomjs'
# 創建瀏覽器對象
browser = webdriver.PhantomJS(path)

# 打開百度並操作
url = 'https://www.baidu.com'
browser.get(url)
time.sleep(1)
# 截圖
browser.save_screenshot('Reptile/phantomjs_img/baidu.png')
# 定位搜索框
search = browser.find_element_by_id('kw')
time.sleep(1)
# 在搜索框輸入內容
search.send_keys('美女')
time.sleep(1)
# 截圖
browser.save_screenshot('Reptile/phantomjs_img/meinv.png')
# 關閉瀏覽器
browser.quit()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python爬蟲之網頁的獲取requests的使用 Loguru：Python 日志終極解決方案 Java獲取時間與系統時間相差8小時終極解決方案 Java獲取時間與系統時間相差8小時終極解決方案 Chrome保存整個網頁為圖片(終極解決方案!) Mac無法清倒廢紙簍,終極解決方案 Python中英文對齊終極解決方案 Python 爬蟲 - requests、在 Linux 中使用 curl 命令訪問網頁 EF(EntityFramework)與mysql使用，錯誤終極解決方案 Python爬蟲(八)_Requests的使用