Selenium+python --使用正則表達式爬取頁面的URL鏈接

本文轉載自查看原文 2019-04-10 18:30 1280 Selenium

follow yoyo

# coding:utf-8
from selenium import webdriver
import re

driver = webdriver.Firefox()
driver.get("http://www.cnblogs.com/yoyoketang/")
page = driver.page_source
print(page)
url_list = re.findall('href=\"(.*?)\"',page,re.S)
url_all = []
for url in url_list:
    if "http" in url:
        print(url)
        url_all.append(url)
print(url_all)

很不理解正則表達式的樣式，不明白是什么意思：href=\"(.*?)\"
for...in..循環遍歷

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【python爬蟲和正則表達式】爬取表格中的的二級鏈接 Python-使用requests庫和正則表達式爬取淘寶商品信息 Python爬蟲：使用正則表達式爬取網站電影信息 python的url正則表達式 python的url正則表達式正則表達式爬取小說各章節鏈接 Python 使用正則表達式匹配URL網址 Python 使用正則表達式匹配URL網址爬蟲之正則表達式的應用爬取 [python] 常用正則表達式爬取網頁信息及分析HTML標簽總結