python爬取当当网书籍信息

本文转载自查看原文 2020-09-27 14:40 558 python

'''
url
http://book.dangdang.com/
请求方式
GET
请求头
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36
请求参数

'''
#1.导入模块
import requests

from lxml import html
etree=html.etree

#2.发送请求

response=requests.get(
    url="http://book.dangdang.com/",
    headers={
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36"
    }
)
#处理响应

eroot=etree.HTML(response.text)

# print(response.text)

#使用Xpath爬取当当数据
#//li/a/@title  广泛书名
#//li/a/img/@src 图片

#推荐书籍的列表
#//div[@id="book_reco"]/ul/li/p/a/text() 规范书名
#//div[@id="book_reco"]/ul/li/p[@class="price"]  规范价格
#//div[@id="book_reco"]/ul/li/a/img/@src 书籍图片

#//div[@class="over"]/ul/li/ul/li/a/@title 书名
#//div[@class="over"]/ul/li/ul/li/a/img/@src 照片
#//div[@class="over"]/ul/li/ul/li/p[@class="price"]/span[@class="rob"]价格

div_list=eroot.xpath('//div[@class="over"]/ul/li/ul/li')

for li in div_list:
    item={}
    #书名
    item["name"]=li.xpath('./a/@title')[0]
    #书籍价格
    item["price"]=li.xpath('./p[@class="price"]/span')[0]
    #照片连接
    item["img"]=li.xpath('./a/img/@src')[0]
    print(item)


print(eroot.xpath('//div[@class="over"]/ul/li/ul/li/a/@title'))

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 python爬虫案例-爬取当当网数据 scrapy爬取当当网爬取当当网图书销售排行榜（Python） Python爬取豆瓣书籍信息及分析 (转)python爬取拉勾网信息 python爬取中国知网部分论文信息 Python学习之路（六）爬虫（五）爬取拉勾网招聘信息 Python3爬取豆瓣网电影信息 python爬取豆瓣书籍排行爬虫---爬取拉钩信息网