python使用chrome抓取頁面中ajax請求返回的數據

本文轉載自查看原文 2019-04-12 14:31 909 python/ chrome/ webdriver

#-*-coding:utf-8-*-

from time import sleep
from selenium import webdriver
import json
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities

# 過濾出數據請求中的headers
def getHttpInfo(browser):
    for responseReceived in browser.get_log('performance'):
        try:
            response = json.loads(responseReceived[u'message'])[u'message'][u'params'][u'response']
            if 'ajaxUrl' in response['url']:
                # print(response)
                # print(response['url'])
                # print(response['headers'])
                # print(response['headersText'])
                return response['requestHeaders']
        except:
            pass
    return None

# 請求頁面 並設置headers到文件中
def setHeaders():
    d = DesiredCapabilities.CHROME
    d['loggingPrefs'] = { 'performance':'ALL' }
    options=webdriver.ChromeOptions()
    options.set_headless()
    options.add_argument('--disable-gpu')

    driver=webdriver.Chrome(desired_capabilities=d,options=options)
    driver.get('http://www.baidu.com')
    sleep(20)
    headers = getHttpInfo(driver)
    driver.quit()
    # write header
    hand = open('header.txt', 'w')
    hand.write(json.dumps(headers))
    hand.close()

if __name__ == '__main__':
    setHeaders()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python爬蟲---實現項目(二) 分析Ajax請求抓取數據 Ajax在靜態頁面中向指定url發送json請求獲取返回的json數據 jquery中獲取ajax請求返回數據的方法 ajax請求拿到多條數據拼接顯示在頁面中使用Chrome快速實現數據的抓取（五）—— puppeteer 使用Chrome快速實現數據的抓取（二）——協議使用Chrome快速實現數據的抓取（三）——JQuery 使用jquery通過AJAX請求方式，后台返回了當前整個HTML頁面代碼 ajax請求、servlet返回json數據 ajax請求和aspx返回數據