第一次实战,我们以博客园为例。 Cnblog是典型的静态网页,通过查看博文的源代码,可以看出很少js代码,连css代码也比较简单,很适合爬虫初学者来练习。 博客园的栗子,我们的目标是获取某个博主的所有博文,今天先将第一步。 第一步:已知某一篇文章的url,如何获取正文? 举个栗子 ...
首先我们用火狐浏览器firebug插件模拟一下在博客园发布一篇文章时post的数据是怎么样的。 打开自己的博客园登录。 点击添加新随笔。 写好标题和内容。 打开firebug,点击文章发布。捕捉到post数据如下。 把post数据填入下面的代码就可。 View Code 成功发布 ...
2014-02-15 10:31 7 1749 推荐指数:
第一次实战,我们以博客园为例。 Cnblog是典型的静态网页,通过查看博文的源代码,可以看出很少js代码,连css代码也比较简单,很适合爬虫初学者来练习。 博客园的栗子,我们的目标是获取某个博主的所有博文,今天先将第一步。 第一步:已知某一篇文章的url,如何获取正文? 举个栗子 ...
最近在开发一个博客系统,经常把写的东西放在自己网站的博客上(之前写在Onenote),然后我在博客园也申请了一个博客,就有了同样一篇文章,我需要复制粘贴排版分别提交两次的情况。于是我就想能不能在我的网站内提交后直接把这篇文章同步提交至博客园甚至是其他第三方博客呢,所以花点时间实现了这个功能 ...
很多读者问我:“二哥,你怎么不整理一篇 2019 年的文章列表呢?”说实话,我有些惭愧,因为有些文章写得很烂,我自己都不好意思再重读,真的辛苦了那些老读者,不离不弃的精神打动了我(😭)。 当然也有一些文章广受好评,毕竟 2019 年我写了差不多 100 篇原创文章,这里就姑且把阅读量前 ...
文章来自 http://www.cnblogs.com/jirigala/archive/2009/07/17/1525920.html 看完之后,不免产生了一些共鸣,上述文章是2009年的,就已经对当时的论坛的发展做出了惊人的正确的预测。 时隔5年,的确如上述博主所料, 因为开发者 ...
最近在做Android版的博客园客户端,在考虑添加入登录功能,以实现获取更多的信息。 现在测试使用HttpClient进行模拟登陆。 登录页面:http://passport.cnblogs.com/login.aspx 登录结果页面:http://home.cnblogs.com ...
Python模拟登录第一弹见:【Python数据分析】Python模拟登录(一) requests.Session应用上次的登录是最基本的,全部是明文,而且在浏览器中就可以看到POST的数据。接下来我们来个稍微难一点的–模拟登录博客园(http://www.cnblogs.com) 登录特点 ...
大家好呀!萌新入住博客园QAQ,QWQ`` 大学生涯目标: 区域赛银牌(目前沈阳打铁,济南打铁,ccpc东北赛铜 QAQ--逃) 买一辆小摩托 GSX250 || Z400 全栈工程师 全栈开发 能跟 LAOT && can哥 一样强 555QAQ ...
如何用markdown在博客园里发第一篇博客## markdown是一种标记语言,在markdown编辑器中编辑好的内容会自动生成html代码,将生成的文档代码拷贝到博客园的编辑器中,选择发布即可。 初次使用博客园写博客,以此作为记录。 1.在博客园创建自己的博客### 具体创建博客见百度 ...