python 網頁抓取並保存圖片

本文轉載自查看原文 2015-08-22 15:32 4058

#-*-coding:utf-8-*-

import os
import uuid
import urllib2
import cookielib

'''獲取文件后綴名'''
def get_file_extension(file): 
return os.path.splitext(file)[1]

'''創建文件目錄，並返回該目錄'''
def mkdir(path):
# 去除左右兩邊的空格
path=path.strip()
# 去除尾部 \符號
path=path.rstrip("\\")

if not os.path.exists(path):
os.makedirs(path)

return path

'''自動生成一個唯一的字符串，固定長度為36'''
def unique_str():
return str(uuid.uuid1())

'''
抓取網頁文件內容，保存到內存

@url 欲抓取文件 ，path+filename
'''
def get_file(url):
try:
cj=cookielib.LWPCookieJar()
opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
urllib2.install_opener(opener)

req=urllib2.Request(url)
operate=opener.open(req)
data=operate.read()
return data
except BaseException, e:
print e
return None

'''
保存文件到本地

@path 本地路徑
@file_name 文件名
@data 文件內容
'''
def save_file(path, file_name, data):
if data == None:
return

mkdir(path)
if(not path.endswith("/")):
path=path+"/"
file=open(path+file_name, "wb")
file.write(data)
file.flush()
file.close()


#獲取文件后綴名
print get_file_extension("123.jpg");

#創建文件目錄，並返回該目錄
#print mkdir("d:/ljq")

#自動生成一個唯一的字符串，固定長度為36
print unique_str()

url="http://qlogo1.store.qq.com/qzone/416501600/416501600/100?0";
save_file("d:/ljq/", "123.jpg", get_file(url))

轉自：http://www.cnblogs.com/linjiqin/p/3672285.html

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python抓取網頁中圖片並保存到本地 Python抓取網頁並保存為PDF python 圖片抓取並保存到本地 Python3簡單爬蟲抓取網頁圖片 python 圖片爬蟲抓取圖片系列一——爬取指定網頁中的圖片 Python抓取需要cookie的網頁 Python 多線程抓取網頁 python抓取網頁內容 WebMagic 抓取圖片並保存至本地抓取網頁圖片和文字信息並下載