有點閑時間就想跟”博客園過意不去“,每天逛博客園趕腳閃存挺好,就是"常駐人口"眾多,其他偶爾來一次,大家交流也是挺方便的,於是乎我就想看看閃存"常駐人口"有哪些?根據他們發閃的頻率來判斷他們的狀態。呵呵,所以就想到了抓取數據分析,本來想弄個c#版,但是c#不是我的強項,時間關系我就搞了一個java ...
上次我們分析了博客園閃存數據,為什么分析 那是出於個人想看看,意義不大,反正閑着也是閑着搗鼓搗鼓沒什么不好,后來沒有分享技術,這次我們分享一下技術,不過再分享之前,我們先來看看我又趁着,這熱乎勁抓取了一把博文首頁的數據分析了一下 數據來自 : 至 : ,大概三個月的時間,共計 k數據,也就是說這三個月總計首頁發布了 k的文章,不錯的效益。這次有點意外 個線程花了 min多一點的時間跑完 ,熱騰騰 ...
2013-08-28 12:12 29 2615 推薦指數:
有點閑時間就想跟”博客園過意不去“,每天逛博客園趕腳閃存挺好,就是"常駐人口"眾多,其他偶爾來一次,大家交流也是挺方便的,於是乎我就想看看閃存"常駐人口"有哪些?根據他們發閃的頻率來判斷他們的狀態。呵呵,所以就想到了抓取數據分析,本來想弄個c#版,但是c#不是我的強項,時間關系我就搞了一個java ...
最近 "個人惡趣味" 持續泛濫。 博客的訪問量、粉絲數一直是滿足樓主個人虛榮心的好東西(原諒樓主也是凡人愛慕 "虛榮"),有時候我就在想,同一篇隨筆,不同時間段發表是不是能獲得不同的閱讀量,換句話說,博文質量相同的情況下,哪個時間段的閱讀量可能會多一些呢,於是決定讓數據說話。(我會告訴你其實是 ...
就只剩這張圖了,所以免為其難得分享下,別弄丟了。 經驗分享 這不怎么好看,但是也分享下,很簡單也就是靠一定的水流下來然后沖擊,給車提供動力,這樣它就動了。不過這里很看重的是動手,不能光靠理論能搞定的,等你自己去實踐了以后才會發現各種問題,推薦剛來大學或者之前可以試着做來玩玩 ...
引言 最近LZ一直忙於搭建自己的個人博客,目前已經初見成效,雖然很多功能還不完善,但看看文章,評論評論還是沒問題的。俗話說,80%的需求是20%的功能滿足的,目前LZ的個人博客就屬於這個狀態。 搭建個人博客的初衷 搭建個人博客有幾個原因吧,總結起來主要有 ...
有選擇性的重復造一些輪子,未必是件壞事。Aaron的博客上加了一個懸浮菜單,貌似顯得很高大上了。雖然這類小把戲也不是頭一次見了,但是從未自己寫過。今天就選擇性的拿這個功能寫一寫。下面是這個輪子的開發過程,也可以當作是一篇需求文檔的分析和實現過程。 演示地址:http ...
1初步開始 1.1依賴 這個倉儲包含一系列基於bootstrap標識和css樣式的原生angular2指令。所以是不需要依賴jq和bootstrap.js的。只需要以下依賴即可: Angular ...
博客園-博文自動發布工具 1、介紹 該工具內置自動將本地的markdown文件通過metaWebBlog協議上傳到博客園(也可以是其他支持該協議的博客網站),並內置圖床功能,省去編寫博文時上傳圖片的麻煩。該工具配合typora markdown編寫工具是最佳組合。實時預覽與數學公式及希臘字母 ...
其實寫這篇文章,我是很忐忑的,因為爬取的內容就是博客園的,萬一哪個頑皮的小伙伴拿去干壞事,我豈不成共犯了? 好了,進入主題。 首先,爬蟲需要用到的模塊有: express ejs superagent (nodejs里一個非常方便的客戶端請求代理模塊) cheerio ...