原文:学习笔记(爬虫):爬取古诗网站,获取每一篇古诗,并保存到本地

目标网站 目标网站:https: so.gushiwen.org shiwen default.aspx 爬虫目的 爬取目标网站的文本,如古诗的内容,作者,朝代,并且保存到本地中。 爬虫程序 难点与思考 本次爬虫难点在于,正则表达式的使用,如使用正则表达式匹配古诗正文 古诗作者 古诗标题。正则表达式的使用,需要找到需要匹配的内容的前项和后项,这样才能精准的定位到需要匹配的内容。如匹配古诗正文: ...

2020-04-09 19:21 0 689 推荐指数:

查看详情

Python爬虫-古诗

今天学习了一些简单的爬虫知识,并应用这些知识撸了一古诗的程序 主要使用的第三方库:requests,bs4 直接上代码: spider.py : poem.py : 运行 : 取到的数据: poem.txt ...

Thu Jan 20 02:45:00 CST 2022 1 812
Python爬虫目标小说并保存到本地

利用Python爬虫目标小说并保存到本地 小说地址:http://book.zongheng.com/showchapter/749819.html(目录地址) 通过小说目录获取小说所有章节对应的url地址,然后逐个访问解析得到每一章节小说的内容,最后保存到本地文件内 文章中的代码 ...

Tue May 19 19:36:00 CST 2020 0 624
python网站上的图片并保存到本地

  1.导入需要的模块requests,BeautifulSoup,os(用于文件读写)。   2.创建一个类,并初始化。 class BeautifulPicture: def _ ...

Mon Dec 24 18:45:00 CST 2018 0 7367
python网站视频保存到本地

前言 文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。 作者: Woo_home PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取 http://note.youdao.co-m/noteshare ...

Sat Nov 23 21:42:00 CST 2019 0 1164
Python-爬虫实战 简单豆瓣top250电影保存到本地

爬虫原理 发送数据 获取数据 解析数据 保存数据 requests请求库 res = requests.get(url="目标网站地址") 获取二进制流方法:res.content 获取文本方法:res.text re正则模块 re.findall("匹配规则 ...

Thu Aug 29 03:20:00 CST 2019 0 474
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM