python爬蟲 selenium 抓取今日頭條（ajax異步加載）

本文轉載自查看原文 2018-04-09 19:02 4267 今日頭條/ selenium/ Python

from selenium import webdriver
from lxml import etree
from pyquery import PyQuery as pq
import time

driver = webdriver.Chrome()
driver.maximize_window()
driver.get('https://www.toutiao.com/')
driver.implicitly_wait(10)
driver.find_element_by_link_text('科技').click()
driver.implicitly_wait(10)
for x in range(3):
    js="var q=document.documentElement.scrollTop="+str(x*500)
    driver.execute_script(js)
    time.sleep(2)

time.sleep(5)
page = driver.page_source
doc = pq(page)
doc = etree.HTML(str(doc))
contents = doc.xpath('//div[@class="wcommonFeed"]/ul/li')
print(contents)
for x in contents:
    title = x.xpath('div/div[1]/div/div[1]/a/text()')
    if title:
        title = title[0]
        with open('toutiao.txt','a+',encoding='utf8')as f:
            f.write(title+'\n')
        print(title)
    else:
        pass

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 爬蟲（八）：分析Ajax請求抓取今日頭條街拍美圖 Python 爬蟲實例（2）—— 爬取今日頭條爬蟲實例：今日頭條爬蟲使用scrapy爬蟲,爬取今日頭條首頁推薦新聞（scrapy+selenium+PhantomJS） Python爬取今日頭條段子 Python3從零開始爬取今日頭條的新聞【二、首頁熱點新聞抓取】 Python的幾個爬蟲代碼整理（網易雲、微信、淘寶、今日頭條） python爬取今日頭條街拍今日頭條的成功史 vue 仿今日頭條

python爬蟲 selenium 抓取 今日頭條（ajax異步加載）

免責聲明！

python爬蟲 selenium 抓取今日頭條（ajax異步加載）