标签【爬虫笔记】

爬虫时url中http和https的区别

今天在爬取一个网页时发现总是爬取不成功，信息量很少，只有几行代码，而原网页代码量是很多的，后来我把url中的https换成了http后就把网页源码全部爬取了，查了资料后发现url中使用http和htt ...

BeautifulSoup4的使用方法

BeautifulSoup是一个可以从HTML或XML文件中提取数据的Python库，它能实现文档的导航和查找,修改文档等操作官方文档地址："https://beautifulsoup.readt ...

爬虫2.2-scrapy框架-文件写入

scrapy框架-文件写入目录 scrapy框架-文件写入 1. lowb写法 2. 高端一点的写法 3. 优化版本 1. ...

1.声明浏览器对象 2.访问页面 3.节点查找 3.1 单个节点从淘宝首页提取搜索框运行结果为WebElement类型，<se ...