python使用chrome抓取页面中ajax请求返回的数据

本文转载自查看原文 2019-04-12 14:31 909 python/ chrome/ webdriver

#-*-coding:utf-8-*-

from time import sleep
from selenium import webdriver
import json
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities

# 过滤出数据请求中的headers
def getHttpInfo(browser):
    for responseReceived in browser.get_log('performance'):
        try:
            response = json.loads(responseReceived[u'message'])[u'message'][u'params'][u'response']
            if 'ajaxUrl' in response['url']:
                # print(response)
                # print(response['url'])
                # print(response['headers'])
                # print(response['headersText'])
                return response['requestHeaders']
        except:
            pass
    return None

# 请求页面 并设置headers到文件中
def setHeaders():
    d = DesiredCapabilities.CHROME
    d['loggingPrefs'] = { 'performance':'ALL' }
    options=webdriver.ChromeOptions()
    options.set_headless()
    options.add_argument('--disable-gpu')

    driver=webdriver.Chrome(desired_capabilities=d,options=options)
    driver.get('http://www.baidu.com')
    sleep(20)
    headers = getHttpInfo(driver)
    driver.quit()
    # write header
    hand = open('header.txt', 'w')
    hand.write(json.dumps(headers))
    hand.close()

if __name__ == '__main__':
    setHeaders()

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 python爬虫---实现项目(二) 分析Ajax请求抓取数据 Ajax在静态页面中向指定url发送json请求获取返回的json数据 jquery中获取ajax请求返回数据的方法 ajax请求拿到多条数据拼接显示在页面中使用Chrome快速实现数据的抓取（五）—— puppeteer 使用Chrome快速实现数据的抓取（二）——协议使用Chrome快速实现数据的抓取（三）——JQuery 使用jquery通过AJAX请求方式，后台返回了当前整个HTML页面代码 ajax请求、servlet返回json数据 ajax请求和aspx返回数据