#https://www.cnblogs.com/zjltt/p/6955965.html 寫的比較好的正則網站 #寫個簡單的爬蟲,把這個鏈接http://so.fengniao.com/index.php?action=Image&keyword=%E7%A7%81%E6%88%BF,里面所有的圖片保存到本地 import requests import re #獲取URL返回內容 def url_text(url): text = requests.get(url) return text.text #返回內容截取IMG的URL def img_url(text): img_list=re.findall('\<img.*/\>\</a\>',text) #正則提取img標簽 img_url_list=[] #定義放img圖片的url for row in img_list: img_url_list.append(row.split(' ')[1].split('"')[1]) #對IMG標簽分割,提取URL部分,放入list return img_url_list #返回img的URL的list
#下載圖片函數 def download_img(img_url_list,path): for name_num,url in enumerate(img_url_list): #枚舉遍歷圖片list下標及URL img_result=requests.get(url) #請求獲取圖片內容 name="%s%s.jpg"%(path,name_num) #下載圖片的路徑及名稱,名稱是list下標 img_file=open(name,'wb') #二進制打開文件 img_file.write(img_result.content) #把圖片內容寫入文件 close_file(img_file) #關閉文件 #關閉文件 def close_file(file): file.close() path='./pic/' url='http://so.fengniao.com/index.php?action=Image&keyword=%E7%A7%81%E6%88%BF' download_img(img_url(url_text(url)),path) #調取下載圖片函數