原文:Python 爬虫入门——小项目实战(自动私信博客园某篇博客下的评论人,随机发送一条笑话,完整代码在博文最后)

之前写的都是针对爬虫过程中遇到问题的解决方案,没怎么涉及到实际案例。这次,就以博客园为主题,写一个自动私信博客下的评论人员 在本篇留下的评论的同学也会被自动私信,如果不想被私信,同时又有问题,请私信我 。 .确定监控的博客,这里以http: www.cnblogs.com hearzeus p .html为例,后面会更改为本篇博客的博客地址。 .获取博客下的评论人员。 打开浏览器控制台 网络面板 ...

2016-03-03 15:43 61 3776 推荐指数:

查看详情

Python爬虫实现统计博客园数量、阅读量、评论

如何使用 只需要将代码中的headurl替换以下格式,其中你只需要改变以下链接的阴影部分,阴影部分为你的博客园链接。 原理 使用requests爬取网页,再使用BeautifulSoup解析网页,获取数据、对数据做了预处理,最后使用正则匹配,匹配出需要 ...

Thu Mar 12 02:39:00 CST 2020 3 1015
博客园最后,还是要离开了(附带个人博客源码分享)

引言      最近LZ一直忙于搭建自己的个人博客,目前已经初见成效,虽然很多功能还不完善,但看看文章,评论评论还是没问题的。俗话说,80%的需求是20%的功能满足的,目前LZ的个人博客就属于这个状态。    搭建个人博客的初衷      搭建个人博客有几个原因吧,总结起来主要有 ...

Thu May 28 09:03:00 CST 2015 17 5800
博客园爬虫案例效果

置顶随笔 [置顶]Linux企业运维人员最常用150个命令汇总 2017年12月8日 Shell编程基础- 2017年12月7日 memcached 缓存数据库应用实践 2017年12月6日 Shell编程基础-上 2017年12月1日 Jenkins与网站代码上线解决方案 ...

Sat Dec 09 05:45:00 CST 2017 4 17597
python——关于简单爬取博客园班级成员发的的题目、发布、阅读、评论,再存到csv文件中

因为老师要以班里每个人发的博客质量作为最后总成绩的评定的一部分,就要把班上所有同学发的博客都统计起来,可以用来评定的因素有:阅读、评论、推荐等,但因为今天只是做一个简单的爬取,推荐这个元素在班级博客中需要点开每一文才能看到获取,就不爬取了,只爬取阅读和推荐,加上每篇的发布人和标题 ...

Fri Sep 27 04:55:00 CST 2019 6 161
博客园-自动发布工具

博客园-自动发布工具 1、介绍 该工具内置自动将本地的markdown文件通过metaWebBlog协议上传到博客园(也可以是其他支持该协议的博客网站),并内置图床功能,省去编写时上传图片的麻烦。该工具配合typora markdown编写工具是最佳组合。实时预览与数学公式及希腊字母 ...

Fri Aug 31 21:34:00 CST 2018 3 2240
爬虫实战【2】Python博客园-获取某个主所有文章的URL列表

Python博客园-获取某个主所有文章的URL列表 首先,我们来分析一,在主的首页里,每个文章的标题在网页源码中是什么样子的。 【插入图片,文章标题1】 【插入图片,文章标题2】 通过这两个图片我们可以看出,标题所在的标签为,并且具有class属性为"postTitle2 ...

Thu Nov 23 07:31:00 CST 2017 0 2644
爬虫实战【1】使用python爬取博客园的某一文章

第一次实战,我们以博客园为例。 Cnblog是典型的静态网页,通过查看的源代码,可以看出很少js代码,连css代码也比较简单,很适合爬虫初学者来练习。 博客园的栗子,我们的目标是获取某个主的所有,今天先将第一步。 第一步:已知某一文章的url,如何获取正文? 举个栗子 ...

Thu Nov 23 05:02:00 CST 2017 1 4610
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM