有点闲时间就想跟”博客园过意不去“,每天逛博客园赶脚闪存挺好,就是"常驻人口"众多,其他偶尔来一次,大家交流也是挺方便的,于是乎我就想看看闪存"常驻人口"有哪些?根据他们发闪的频率来判断他们的状态。呵呵,所以就想到了抓取数据分析,本来想弄个c#版,但是c#不是我的强项,时间关系我就搞了一个java ...
上次我们分析了博客园闪存数据,为什么分析 那是出于个人想看看,意义不大,反正闲着也是闲着捣鼓捣鼓没什么不好,后来没有分享技术,这次我们分享一下技术,不过再分享之前,我们先来看看我又趁着,这热乎劲抓取了一把博文首页的数据分析了一下 数据来自 : 至 : ,大概三个月的时间,共计 k数据,也就是说这三个月总计首页发布了 k的文章,不错的效益。这次有点意外 个线程花了 min多一点的时间跑完 ,热腾腾 ...
2013-08-28 12:12 29 2615 推荐指数:
有点闲时间就想跟”博客园过意不去“,每天逛博客园赶脚闪存挺好,就是"常驻人口"众多,其他偶尔来一次,大家交流也是挺方便的,于是乎我就想看看闪存"常驻人口"有哪些?根据他们发闪的频率来判断他们的状态。呵呵,所以就想到了抓取数据分析,本来想弄个c#版,但是c#不是我的强项,时间关系我就搞了一个java ...
最近 "个人恶趣味" 持续泛滥。 博客的访问量、粉丝数一直是满足楼主个人虚荣心的好东西(原谅楼主也是凡人爱慕 "虚荣"),有时候我就在想,同一篇随笔,不同时间段发表是不是能获得不同的阅读量,换句话说,博文质量相同的情况下,哪个时间段的阅读量可能会多一些呢,于是决定让数据说话。(我会告诉你其实是 ...
就只剩这张图了,所以免为其难得分享下,别弄丢了。 经验分享 这不怎么好看,但是也分享下,很简单也就是靠一定的水流下来然后冲击,给车提供动力,这样它就动了。不过这里很看重的是动手,不能光靠理论能搞定的,等你自己去实践了以后才会发现各种问题,推荐刚来大学或者之前可以试着做来玩玩 ...
引言 最近LZ一直忙于搭建自己的个人博客,目前已经初见成效,虽然很多功能还不完善,但看看文章,评论评论还是没问题的。俗话说,80%的需求是20%的功能满足的,目前LZ的个人博客就属于这个状态。 搭建个人博客的初衷 搭建个人博客有几个原因吧,总结起来主要有 ...
有选择性的重复造一些轮子,未必是件坏事。Aaron的博客上加了一个悬浮菜单,貌似显得很高大上了。虽然这类小把戏也不是头一次见了,但是从未自己写过。今天就选择性的拿这个功能写一写。下面是这个轮子的开发过程,也可以当作是一篇需求文档的分析和实现过程。 演示地址:http ...
1初步开始 1.1依赖 这个仓储包含一系列基于bootstrap标识和css样式的原生angular2指令。所以是不需要依赖jq和bootstrap.js的。只需要以下依赖即可: Angular ...
博客园-博文自动发布工具 1、介绍 该工具内置自动将本地的markdown文件通过metaWebBlog协议上传到博客园(也可以是其他支持该协议的博客网站),并内置图床功能,省去编写博文时上传图片的麻烦。该工具配合typora markdown编写工具是最佳组合。实时预览与数学公式及希腊字母 ...
其实写这篇文章,我是很忐忑的,因为爬取的内容就是博客园的,万一哪个顽皮的小伙伴拿去干坏事,我岂不成共犯了? 好了,进入主题。 首先,爬虫需要用到的模块有: express ejs superagent (nodejs里一个非常方便的客户端请求代理模块) cheerio ...