python批量檢測鏈接是否可正常打開


通過一些爬蟲腳本爬取圖站圖片,但是發現有些圖片是沒法打開的,可能返回404的code碼

所以設計一個腳本,對所有的圖片地址進行檢查,返回200的保存到另外一個文本內,然后再去下載

 

腳本邏輯很簡單,直接貼代碼,從‘’待檢查地址.txt‘中循環取地址,requests請求地址,’返回碼等於200,循環取出的地址寫到“生成地址.txt”中,

import os
import requests

soure = open('待檢查地址.txt', 'r')
value = soure.readlines()
soure.close()

def stepb(value):
    for url in value:
        url=url[:-1]#去掉換行符,然后url后面會帶個空格,訪問不了鏈接
        r=requests.get(url=url)
        code = r.status_code
        if str(code) == '200':
            print(url+"可正常打開")
            with open('生成地址.txt', 'a') as w:
                w.write(url+'\n')
                w.close()
    print("檢查完成")

stepb(value)

 

下圖1522是本次案例的腳本

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM