文章发出不到30分钟就被首页下架了,默哀…… 起因 为了督促自己更加积极地写博客,我希望有一个排名系统能让我看到自己的进步。但是博客园对用户的排名体系相对是比较少的,主要是推荐博客排行和积分排行;但它们人数少难度大,短期内难以进入排名。因此我决定自力更生,爬取一份博客园粉丝数排行榜。 重要 ...
接触博客园有不短的时间了,今天突然想到,我们博客园各位博友,一天中哪个时间段比较活跃 又有多少夜猫子在深更半夜,冒着 聪明绝顶 的风险熬夜码字看博文 首页所有博文中,哪个博友发布博文数量最多 又是哪个博友大范围 收割 阅读量和评论量 我们的各类排行榜中,谁能独占鳌头 今天,博主就现学现卖,用刚学完基础知识的 python 爬取下博客园相关数据,给大家分享下咱们博客园那些隐藏的 小秘密 。 方案 ...
2018-11-07 10:04 32 4170 推荐指数:
文章发出不到30分钟就被首页下架了,默哀…… 起因 为了督促自己更加积极地写博客,我希望有一个排名系统能让我看到自己的进步。但是博客园对用户的排名体系相对是比较少的,主要是推荐博客排行和积分排行;但它们人数少难度大,短期内难以进入排名。因此我决定自力更生,爬取一份博客园粉丝数排行榜。 重要 ...
许多网站都有排行榜的功能,比如球员人气榜单、阅读排行榜,对于一些小网站,通过查数据库就能实现排行榜的功能,但是对于稍微有点用户量而且还是实时排名的网站,使用一些关系型数据库如(MySQL、Oracle)等来实现就有点力不从心了,而且对数据库的压力也很大,体验也不好,更好的选择是使用Redis ...
变量全都是引用 跟其他编程语言不同,Python的变量不是盒子,不会存储数据,它们只是引用,就像标签一样,贴在对象上面。 比如: a变量和b变量引用的是同一个列表[1, 2, 3]。b可以叫做a的别名。 比较来看: c引用的是另外一个列表,虽然和a引用的列表的值相等 ...
。所以用Python抓取了这100位推荐博客,简单分析了每个博客的文章分类,阅读排行榜,评论排行榜及推荐排行榜 ...
Python 中的sys 模块极为基础而重要,它主要提供了一些给解释器使用(或由它维护)的变量,以及一些与解释器强交互的函数。 本文将会频繁地使用该模块的getsizeof() 方法,因此,我先简要介绍一下: 该方法用于获取一个对象的字节大小(bytes) 它只计算直接占用的内存 ...
装逼手册之 python中的内存分配的小秘密 虽然我们现在得益于时代和技术的发展,不用再担心内存的问题;但是遥想当年,都是恨不得一个钢镚掰成俩份用,所以我就想深入了解一下,在python中内存分配的一些小秘密。 首先我会频繁地用到sys模块里的getsizeof()方法,简单介绍下 ...
由于是第一次谈恋爱,所以呢,对女生不是很了解,今天刚好看到微博榜姐搞了一个“女生哪些小秘密,是很多男生不知道的”,下边竟然有60000条评论! 60000个女生的小秘密啊!作为一个什么都不懂的男孩子,你是否好奇呢?不管你好奇不好奇,反正我是挺好 ...
就是这样。 这是由于python的内存优化机制造成的,Python在存储一些数字的时候,对内存做了相 ...