python requests庫網頁爬取小實例：亞馬遜商品頁面的爬取

本文轉載自查看原文 2019-04-23 21:11 763 python

由於直接通過requests.get()方法去爬取網頁，它的頭部信息的user-agent顯示的是python-requests/2.21.0，所以亞馬遜網站可能會拒絕訪問。所以我們要更改訪問的頭部信息以對網站進行訪問，更改頭部信息模擬瀏覽器訪問。

#亞馬遜商品頁面的爬取
import requests
url="https://www.amazon.cn/dp/B07GVXHCXH"
try:
    kv={'user-agent':'Mozilla/5.0'}
    r=requests.get(url,headers=kv)
    r.raise_for_status()
    r.encoding=r.apparent_encoding
    print(r.text[1000:2000])
except:
    print("爬取失敗")

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 requests實例1：京東商品頁面的爬取 Python爬蟲三 Requests庫爬取亞馬遜報503錯誤亞馬遜商品頁面的簡單爬取 --Pyhon網絡爬蟲與信息獲取 python requests庫網頁爬取小實例：百度/360搜索關鍵詞提交 JAVA爬取亞馬遜的商品信息 python requests庫爬取視頻 requests庫爬取淘寶商品信息 Python-使用requests庫和正則表達式爬取淘寶商品信息 Python requests 爬取淘寶商品數據，並連接數據庫，保存數據爬蟲之亞馬遜爬取