原文:爬虫笔记(二):爬取药监局所有详情页数据

药监局网址:http: scxk.nmpa.gov.cn: xk 药监局首页: 详情页: 目的:爬取药监局所有详情页信息,保存在本地,以csv文件格式保存。 分析主页: 主页的response返回内容中,包含了这一页中的所有企业的id 修改网页参数page可以实现翻页 所以首先要通过访问主页,获取所有企业id,放到一个list中。 把每一项作为列索引 创建csv文件函数定义 最后将每一个企业id对 ...

2021-01-02 11:41 0 518 推荐指数:

查看详情

Python 爬虫取多页数据

现在有一个需求,取http://www.chinaooc.cn/front/show_index.htm中所有的课程数据。 但是,按照常规的取方法是不可行的,因为数据是分页的: 最关键的是,不管是第几页,浏览器地址栏都是不变的,所以每次爬虫只能取第一页数据 ...

Wed Nov 06 23:03:00 CST 2019 0 2286
电影天堂详情页

取电影天堂最新电影,地址https://www.dytt8.net/html/gndy/dyzz/list_23_1.html 学习的视频中代码有几处跟我的有不同,可以学习 一、 其中提取主演的代码不同,如下 采用的是index的方式. enumerate ...

Thu Feb 21 18:54:00 CST 2019 0 21047
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM