頁面源代碼:page_source屬性
獲取源代碼之后,再用正則表達式匹配出所有的鏈接,代碼如下:
#coding:utf-8 from selenium import webdriver import re #引入正則表達式 dr = webdriver.Firefox() dr.get('https://www.baidu.com') source = dr.page_source #獲取網頁源代碼 #print(source) linklist = re.findall(r'<a.*?</a>',source) #匹配所有的a節點 print("the number of link : %d."%len(linklist)) #鏈接個數 for link in linklist: #打印出所有link print(link) dr.quit()