import urllib.request import re #解析html的內容 def getHtml(url): page=urllib.request.urlopen(url) html=page.read() return html #從html獲取想要的圖片信息 def getImg(html): reg = 'src="(.+?\.png)"' #正則表達式表示出想要獲取的部分信息 img = re.compile(reg) #生成一個正則表達式對象 html =html.decode('utf-8') #防止中文亂碼 imglist = re.findall(img, html) #讀取圖片信息 print(imglist) x = 0 length = len(imglist) print(length) for i in range(length): #取前6張圖片保存 imgurl = imglist[i] imgurl2 = re.sub('"(.*?)"',r'\1',imgurl) # 獲取單引號里的雙引號內容 print(imgurl+':'+imgurl2) # urllib.request.urlretrieve(imgurl, '%s.jpg' % x) #將圖片從遠程下載到本地 # x+=124 html = getHtml("http://www.shangxueba.com/jingyan/2438398.html") getImg(html)
生成的結果如下:

如有疑問,請留言。
如覺得有幫助,請點個贊,謝謝!
