簡單的爬蟲demo

本文轉載自查看原文 2017-07-08 16:27 1191 Python

# coding=<encoding name> 例如，可添加# coding=utf-8
import urllib
import re
# 定義一個方法，把整個頁面下載下來
def getHtml(url):
    page = urllib.urlopen(url)   # 打開網頁
    html = page.read()             #讀取 URL上面的數據
    return html                  # 返回內容

# 再定義一個方法，篩選頁面中想要的元素，通過正則表達式的匹配
def getimage(html):
    reg = r'src="(.+?\.jpg)" pic_ext'   # 定義一個正則表達式
    # re.compile() 把正則表達式編譯成一個正則表達式對象
    imagere =re.compile(reg)
    # 　re.findall() 方法讀取html 中包含 imgre（正則表達式）的數據。
    imagerelist = re.findall(imagere,html)
    # 遍歷圖片
    x = 0
    for imageurl in imagerelist:
        # 這里的核心是用到了urllib.urlretrieve(),方法，直接將遠程數據下載到本地
        urllib.urlretrieve(imageurl,'%s.jpg'% x)
        x= x+1


# 調用getHtml 傳入一個網址
ht = getHtml("http://tieba.baidu.com/p/2460150866")
# 調用getimage ，拿到圖片
print getimage(ht)

運行的效果

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python 爬蟲簡單的demo 關於使用Java實現的簡單網絡爬蟲Demo python簡單爬蟲抓取視頻demo python簡單爬蟲抓取視頻demo-完善簡單的demo 【Java】Jsoup爬蟲,一個簡單獲取京東商品信息的小Demo 簡單的爬蟲 springboot入門之簡單demo leaflet簡單操作demo vue簡單demo