python 獲取圖片並自動命名保存

本文轉載自查看原文 2018-07-30 17:09 5702

# -* - coding: UTF-8 -* -
#導入第三方庫
import urllib
from bs4 import BeautifulSoup
import requests
import os
import time
import random
# 獲取文件夾，如果文件夾不存在則創建新文件夾
if os.path.isdir('E://biaoqing//'):
   pass
else:
   os.mkdir('E://biaoqing//')
get_url='http://qq.yh31.com'
i=58
while i>0:
    print('第%s頁：'%str(59 - int(i)))
    local = "E:\\biaoqing\\"  # 保存圖片的文件夾
    url = 'http://qq.yh31.com/ka/qw/List_%s.html'% i
    Agent = [
        'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0',
        'Mozilla/5.0 (X11; U; Linux x86_64; zh-CN; rv:1.9.2.10) Gecko/20100922 Ubuntu/10.10 (maverick) Firefox/3.6.10',
        'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36',
        'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.64 Safari/537.11',
        'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; QQDownload 732; .NET4.0C; .NET4.0E)',
        'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.139 Safari/537.36'
    ]
    User_Agent = random.choice(Agent)
    headers = {'User-Agent': User_Agent}
    html_ = requests.get(url, headers=headers)
    html_.encoding = 'utf-8'
    html_doc=html_.text
    soup = BeautifulSoup(html_doc, 'lxml')  # 解析 html_doc
    # 獲取所有img標簽里面 屬性border值為0的img標簽
    pss = soup.find_all('img',attrs={'border':0})
    for ims in pss:
        img_url = get_url + ims['src']  # 圖片的路徑
        print(img_url)
        mingcheng = '%s' % ims['alt']  # 圖片命名所用，alt內容為圖片名稱
        s = '%s' % ims['src']  # 獲取字符 截取相應的名稱及格式
        geshi = s.split('.')[-1]  # 圖片命名所用，獲取圖片的格式
        ming=mingcheng+'.'+geshi
        urllib.request.urlretrieve(img_url, local + '%s'%ming)
        time.sleep(0.5)
    print('=====================================================')
    i=i-1
    time.sleep(2)  # 設置休眠時間，訪問頻繁容易被封

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python獲取圖片類型 python實現批量提取圖片中的信息並保存 python 爬取圖片路徑規則並保存本地 python 使用 tesserocr 來獲取圖片驗證碼 Python PhatomJS 和Selenium動態加載頁面獲取圖片內容使用Python獲取圖片的物理尺寸(KB) Python 獲取圖片格式及像素寬高信息 Python多線程Threading爬取圖片，保存本地，openpyxl批量插入圖片到Excel表中 iOS開發中，獲取圖片之后保存或下載到本地相冊中 js獲取圖片信息