文章發出不到30分鍾就被首頁下架了,默哀…… 起因 為了督促自己更加積極地寫博客,我希望有一個排名系統能讓我看到自己的進步。但是博客園對用戶的排名體系相對是比較少的,主要是推薦博客排行和積分排行;但它們人數少難度大,短期內難以進入排名。因此我決定自力更生,爬取一份博客園粉絲數排行榜。 重要 ...
接觸博客園有不短的時間了,今天突然想到,我們博客園各位博友,一天中哪個時間段比較活躍 又有多少夜貓子在深更半夜,冒着 聰明絕頂 的風險熬夜碼字看博文 首頁所有博文中,哪個博友發布博文數量最多 又是哪個博友大范圍 收割 閱讀量和評論量 我們的各類排行榜中,誰能獨占鰲頭 今天,博主就現學現賣,用剛學完基礎知識的 python 爬取下博客園相關數據,給大家分享下咱們博客園那些隱藏的 小秘密 。 方案 ...
2018-11-07 10:04 32 4170 推薦指數:
文章發出不到30分鍾就被首頁下架了,默哀…… 起因 為了督促自己更加積極地寫博客,我希望有一個排名系統能讓我看到自己的進步。但是博客園對用戶的排名體系相對是比較少的,主要是推薦博客排行和積分排行;但它們人數少難度大,短期內難以進入排名。因此我決定自力更生,爬取一份博客園粉絲數排行榜。 重要 ...
許多網站都有排行榜的功能,比如球員人氣榜單、閱讀排行榜,對於一些小網站,通過查數據庫就能實現排行榜的功能,但是對於稍微有點用戶量而且還是實時排名的網站,使用一些關系型數據庫如(MySQL、Oracle)等來實現就有點力不從心了,而且對數據庫的壓力也很大,體驗也不好,更好的選擇是使用Redis ...
變量全都是引用 跟其他編程語言不同,Python的變量不是盒子,不會存儲數據,它們只是引用,就像標簽一樣,貼在對象上面。 比如: a變量和b變量引用的是同一個列表[1, 2, 3]。b可以叫做a的別名。 比較來看: c引用的是另外一個列表,雖然和a引用的列表的值相等 ...
。所以用Python抓取了這100位推薦博客,簡單分析了每個博客的文章分類,閱讀排行榜,評論排行榜及推薦排行榜 ...
Python 中的sys 模塊極為基礎而重要,它主要提供了一些給解釋器使用(或由它維護)的變量,以及一些與解釋器強交互的函數。 本文將會頻繁地使用該模塊的getsizeof() 方法,因此,我先簡要介紹一下: 該方法用於獲取一個對象的字節大小(bytes) 它只計算直接占用的內存 ...
裝逼手冊之 python中的內存分配的小秘密 雖然我們現在得益於時代和技術的發展,不用再擔心內存的問題;但是遙想當年,都是恨不得一個鋼鏰掰成倆份用,所以我就想深入了解一下,在python中內存分配的一些小秘密。 首先我會頻繁地用到sys模塊里的getsizeof()方法,簡單介紹下 ...
由於是第一次談戀愛,所以呢,對女生不是很了解,今天剛好看到微博榜姐搞了一個“女生哪些小秘密,是很多男生不知道的”,下邊竟然有60000條評論! 60000個女生的小秘密啊!作為一個什么都不懂的男孩子,你是否好奇呢?不管你好奇不好奇,反正我是挺好 ...
就是這樣。 這是由於python的內存優化機制造成的,Python在存儲一些數字的時候,對內存做了相 ...