用Python寫了個抓圖小腳本


看上這個網頁上一張圖了,可惜他沒有提供右鍵另存為,看了下網頁代碼,是可以找到圖片原始鏈接的!但是因為沒法和現實的圖片一一對應,圖又多,所以找起來還是麻煩。。。然后,我就想用 Python 把他們全部拉下來再找了。

下面是代碼:

#coding=utf-8

import urllib
import re

def downloadPage(url):
    h = urllib.urlopen(url)
    return h.read()

def downloadImg(content):
    pattern = r'href="(.+?\.jpg)" class'
    m = re.compile(pattern)
    urls = re.findall(m, content)

    for i, url in enumerate(urls):
        print url
        urllib.urlretrieve(url, "%s.jpg" % (i, ))

content = downloadPage("http://www.viajesalazul.com/holiday/lo-mejor-de-portugal-11-dias/")
downloadImg(content)

話說,學了正則表達式 要常常練習啊,恩,代碼有借鑒另一作者的(代碼放硬盤里好久了,原始作者已無從查找),自己改了下正則表達式。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM