原文:纯手工[博客园-博文数据分析]及技术分享(java)

上次我们分析了博客园闪存数据,为什么分析 那是出于个人想看看,意义不大,反正闲着也是闲着捣鼓捣鼓没什么不好,后来没有分享技术,这次我们分享一下技术,不过再分享之前,我们先来看看我又趁着,这热乎劲抓取了一把博文首页的数据分析了一下 数据来自 : 至 : ,大概三个月的时间,共计 k数据,也就是说这三个月总计首页发布了 k的文章,不错的效益。这次有点意外 个线程花了 min多一点的时间跑完 ,热腾腾 ...

2013-08-28 12:12 29 2615 推荐指数:

查看详情

纯手工[博客园-闪存数据分析]总结报告

有点闲时间就想跟”博客园过意不去“,每天逛博客园赶脚闪存挺好,就是"常驻人口"众多,其他偶尔来一次,大家交流也是挺方便的,于是乎我就想看看闪存"常驻人口"有哪些?根据他们发闪的频率来判断他们的状态。呵呵,所以就想到了抓取数据分析,本来想弄个c#版,但是c#不是我的强项,时间关系我就搞了一个java ...

Sat Aug 24 00:23:00 CST 2013 47 2408
数据分析】6 点发的文章在博客园阅读量最高?

最近 "个人恶趣味" 持续泛滥。 博客的访问量、粉丝数一直是满足楼主个人虚荣心的好东西(原谅楼主也是凡人爱慕 "虚荣"),有时候我就在想,同一篇随笔,不同时间段发表是不是能获得不同的阅读量,换句话说,文质量相同的情况下,哪个时间段的阅读量可能会多一些呢,于是决定让数据说话。(我会告诉你其实是 ...

Wed Jan 13 16:39:00 CST 2016 41 3747
[趣味分享]纯手工制作的水动力小车

就只剩这张图了,所以免为其难得分享下,别弄丢了。 经验分享 这不怎么好看,但是也分享下,很简单也就是靠一定的水流下来然后冲击,给车提供动力,这样它就动了。不过这里很看重的是动,不能光靠理论能搞定的,等你自己去实践了以后才会发现各种问题,推荐刚来大学或者之前可以试着做来玩玩 ...

Mon Dec 26 22:33:00 CST 2016 0 1532
博客园的最后一篇,还是要离开了(附带个人博客源码分享

引言      最近LZ一直忙于搭建自己的个人博客,目前已经初见成效,虽然很多功能还不完善,但看看文章,评论评论还是没问题的。俗话说,80%的需求是20%的功能满足的,目前LZ的个人博客就属于这个状态。    搭建个人博客的初衷      搭建个人博客有几个原因吧,总结起来主要有 ...

Thu May 28 09:03:00 CST 2015 17 5800
纯手工打造悬浮菜单

有选择性的重复造一些轮子,未必是件坏事。Aaron的博客上加了一个悬浮菜单,貌似显得很高大上了。虽然这类小把戏也不是头一次见了,但是从未自己写过。今天就选择性的拿这个功能写一写。下面是这个轮子的开发过程,也可以当作是一篇需求文档的分析和实现过程。 演示地址:http ...

Thu Feb 12 00:42:00 CST 2015 6 1598
bootstrap4中版(纯手工翻译)

1初步开始 1.1依赖 这个仓储包含一系列基于bootstrap标识和css样式的原生angular2指令。所以是不需要依赖jq和bootstrap.js的。只需要以下依赖即可: Angular ...

Tue Dec 13 22:03:00 CST 2016 1 4205
博客园-自动发布工具

博客园-自动发布工具 1、介绍 该工具内置自动将本地的markdown文件通过metaWebBlog协议上传到博客园(也可以是其他支持该协议的博客网站),并内置图床功能,省去编写时上传图片的麻烦。该工具配合typora markdown编写工具是最佳组合。实时预览与数学公式及希腊字母 ...

Fri Aug 31 21:34:00 CST 2018 3 2240
nodejs爬取博客园

其实写这篇文章,我是很忐忑的,因为爬取的内容就是博客园的,万一哪个顽皮的小伙伴拿去干坏事,我岂不成共犯了? 好了,进入主题。 首先,爬虫需要用到的模块有: express ejs superagent (nodejs里一个非常方便的客户端请求代理模块) cheerio ...

Thu Jan 19 19:08:00 CST 2017 11 925
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM