爬蟲網站圖片且保存到本地


 

#https://www.cnblogs.com/zjltt/p/6955965.html 寫的比較好的正則網站
#寫個簡單的爬蟲,把這個鏈接http://so.fengniao.com/index.php?action=Image&keyword=%E7%A7%81%E6%88%BF,里面所有的圖片保存到本地
import  requests
import  re

#獲取URL返回內容
def url_text(url):
    text = requests.get(url)
    return  text.text

#返回內容截取IMG的URL
def img_url(text):
    img_list=re.findall('\<img.*/\>\</a\>',text) #正則提取img標簽
    img_url_list=[] #定義放img圖片的url
    for row in img_list:
        img_url_list.append(row.split(' ')[1].split('"')[1]) #對IMG標簽分割,提取URL部分,放入list
    return img_url_list #返回img的URL的list

#下載圖片函數 def download_img(img_url_list,path): for name_num,url in enumerate(img_url_list): #枚舉遍歷圖片list下標及URL img_result=requests.get(url) #請求獲取圖片內容 name="%s%s.jpg"%(path,name_num) #下載圖片的路徑及名稱,名稱是list下標 img_file=open(name,'wb') #二進制打開文件 img_file.write(img_result.content) #把圖片內容寫入文件 close_file(img_file) #關閉文件 #關閉文件 def close_file(file): file.close() path='./pic/' url='http://so.fengniao.com/index.php?action=Image&keyword=%E7%A7%81%E6%88%BF' download_img(img_url(url_text(url)),path) #調取下載圖片函數

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM