MD5
md5的全稱是
md5信息摘要算法(英文:MD5 Message-Digest Algorithm ),一種被廣泛使用的密碼散列函數,可以產生一個128位(16字節,1字節8位)的散列值(常見的是用32位的16進制表示,比如:0caa3b23b8da53f9e4e041d95dc8fa2c),用於確保信息傳輸的完整一致。
抓取圖片鏈接
這里通過Selenium+headless Chrome的方式抓取的所有<img>里的src屬性,來獲得圖片鏈接
1 chrome_options = webdriver.ChromeOptions() 2 3 chrome_options.add_argument('--headless') 4 chrome_options.add_argument('--disable-gpu') 5 6 driver = webdriver.Chrome(options=chrome_options, executable_path="C:\Program Files (x86)\Google\Chrome\Application\chromedriver.exe") 7 driver.get(url) 8 imgs = driver.find_elements_by_xpath("//img") 9 img_src = [] 10 for img in imgs: 11 src = img.get_attribute("src") 12 img_src.append(src)
MD5值計算
首先用urllib將圖片下載到本地,然后用hashlib里的md5得到md5值
request.urlretrieve(url, "static/temp.jpg") file = open("static/temp.jpg", "rb") md = hashlib.md5() md.update(file.read()) res1 = md1.hexdigest() print(res1)
res1就是圖片的md5值