数据爬虫:爬取一张图片


1.首先是导入urllib.request模块

import urllib.request

2.将图片网址复制下来复制给变量url

url="https://placekitten.com/90/300"

3.将网址解析 后传递给response,然后定义cat来获取respose的参数。

response=urllib.request.urlopen(url)

cat=response.read()

4.用with open ....as将下载的图片命名“cat_400.jpg”,读写方式为"wb"表示是二进制可。最后对f将cat内容写入到文件中。

with open("cat_400.jpg","wb")as f:

  f.write(cat)

 

完整代码:

import urllib.request
url="http://placekitten.com/90/300"
response=urllib.request.urlopen(url)
cat=response.read()
with open("cat_400.jpg","wb")as f:
f.write(cat)


运行结果:

“urllib.request”模块有一个“urlretrieve()”方法,这个方法用来下载网站信息,基本格式是:urlretrieve(url,filename=None,reporthook=None,data=None)

filename指定了保存本地路径(如果没有指定,urllib会生成一个临时文件保存数据)

reporthook是一个回调函数,当连接上服务器、以及相应的数据块传输完毕时会触发该回调,可以用它显示当前下载的进度。

data指post到服务器的数据,此方法返回一个包含两个元素的(filename,headers)元组

import urllib.request
url="http://placekitten.com/90/300"
filename="cat_40.jpg"
urllib.request.urlretrieve(url,filename,None,None)


 

 

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM