爬蟲之動態HTML處理（Selenium與PhantomJS ）動態頁面模擬點擊

本文轉載自查看原文 2017-03-06 23:30 5035 爬蟲

動態頁面模擬點擊

#!/usr/bin/env python # -*- coding:utf-8 -*- # python的測試模塊 import unittest from selenium import webdriver from bs4 import BeautifulSoup class douyuSelenium(unittest.TestCase): # 初始化方法 def setUp(self): self.driver = webdriver.PhantomJS() #具體的測試用例方法，一定要以test開頭 def testDouyu(self): self.driver.get('http://www.douyu.com/directory/all') while True: # 指定xml解析 soup = BeautifulSoup(driver.page_source, 'xml') # 返回當前頁面所有房間標題列表 和 觀眾人數列表 titles = soup.find_all('h3', {'class': 'ellipsis'}) nums = soup.find_all('span', {'class': 'dy-num fr'}) # 使用zip()函數來可以把列表合並，並創建一個元組對的列表[(1,2), (3,4)] for title, num in zip(nums, titles): print u"觀眾人數:" + num.get_text().strip(), u"\t房間標題: " + title.get_text().strip() # page_source.find()未找到內容則返回-1 if driver.page_source.find('shark-pager-disable-next') != -1: break # 模擬下一頁點擊 self.driver.find_element_by_class_name('shark-pager-next').click() # 退出時的清理方法 def tearDown(self): print '加載完成...' self.driver.quit() if __name__ == "__main__": unittest.main()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 爬蟲之動態HTML處理（Selenium與PhantomJS ）網站模擬登錄爬蟲之動態HTML處理（Selenium與PhantomJS ）七、Selenium與phantomJS----------動態頁面模擬點擊、網站模擬登錄爬蟲之動態HTML處理（Selenium與PhantomJS ）執行 JavaScript 語句 java爬蟲（五）利用selenium 模擬點擊獲取動態頁面的內容 Python爬蟲(二十三)_selenium案例：動態模擬頁面點擊【爬蟲】selenium動態頁面請求與模擬登錄知乎 Python爬蟲使用Selenium+PhantomJS抓取Ajax和動態HTML內容 python爬蟲 selenium+phantomjs動態解析網頁，加載頁面成功，返回空數據動態爬蟲——selenium2搭載phantomjs入門范例