python requests库网页爬取小实例：亚马逊商品页面的爬取

本文转载自查看原文 2019-04-23 21:11 763 python

由于直接通过requests.get()方法去爬取网页，它的头部信息的user-agent显示的是python-requests/2.21.0，所以亚马逊网站可能会拒绝访问。所以我们要更改访问的头部信息以对网站进行访问，更改头部信息模拟浏览器访问。

#亚马逊商品页面的爬取
import requests
url="https://www.amazon.cn/dp/B07GVXHCXH"
try:
    kv={'user-agent':'Mozilla/5.0'}
    r=requests.get(url,headers=kv)
    r.raise_for_status()
    r.encoding=r.apparent_encoding
    print(r.text[1000:2000])
except:
    print("爬取失败")

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 requests实例1：京东商品页面的爬取 Python爬虫三 Requests库爬取亚马逊报503错误亚马逊商品页面的简单爬取 --Pyhon网络爬虫与信息获取 python requests库网页爬取小实例：百度/360搜索关键词提交 JAVA爬取亚马逊的商品信息 python requests库爬取视频 requests库爬取淘宝商品信息 Python-使用requests库和正则表达式爬取淘宝商品信息 Python requests 爬取淘宝商品数据，并连接数据库，保存数据爬虫之亚马逊爬取