博客園博客下載工具 完美下載所有博客 保存格式為DOC,PDF,EPUB,XPS


做技術經常要查詢資料,也有保存收藏資料的習慣。 博客園是個好地方,資料的質量比較高,整體關注某一個系列的資料,從這邊入手會比較好。我自己也經常寫博客,收集有用的技術資料。在前年,我設計了一套Data Solution解決方案,后來因多方原因擱淺,沒有深入下去。具體內容請參考相關連接,地址是http://www.cnblogs.com/JamesLi2015/archive/2011/11.html

Data Solution中有一個重要的組件是爬蟲。從博客園中抓取文章到本地文件,可以保存為DOC,PDF,XPS,EPUB等多種格式。最近在群(QQ群: 1637 21037) 里面有需求是要備份博客內容,正好我有這個組件,於是整理一下,奉獻給大家下載使用。

整個程序只有一個界面,不需要第三方運行庫,編譯時以.NET 4為編譯平台。如果不能運行,請先下載.NET 4 運行庫。

image

有二種方法下載博客知識文章。一種方法是以博主Id為主,我把它放在User Id面板中。如上圖所示

輸入的數據格式是:

http://www.cnblogs.com/dudu/
http://www.cnblogs.com/JamesLi2015/

之后點擊Start即可開始下載。

第二種方式是,從一堆html文本中,下載這里面包含的html文章,比如,我比較喜歡一個系列的文章,你可以進去找到相關的聯接,拷貝到這里,點Analysis分析一下有多少聯接,再根據需要選擇,再點Start開始下載。

image

以我的喜好,我把這個網頁中的 http://www.cnblogs.com/AllBloggers.aspx

排名前300的文本拷貝到Text面板中,點Analysi按鈕,再點Select All按鈕,進行下載。

配置頁面的內容是保存格式的配置
image

默認勾選DOC格式,以Word 2003的格式保存。Remove Temp File是下載完成后,刪掉中間文件。

這就是全部的內容。這個工具可以用來下載你喜歡的專題或是博主文章。

來看一下效果,最終下載完成后的效果:

image

 

1  保存為DOC格式是必須的,這個可以編輯,修改,剪切。再延伸一點,你可以把喜歡的片段保存到自己的知識庫中。

以我自己的方式,我喜歡EverNote,2.2 綠色版,不到8M的大小,與數據庫文件放在一起。

image

2 PDF,XPS為只讀格式,如果你不想要,可以從Configuration面板中去掉,不勾選。

3 EPUB格式是方便手機閱讀的,雖然手機中用Office 格式看也可以,以我的經驗,不理想,屏幕小,上下左右移動很頻繁。我這邊沒有測試EPUB格式的手機,如果EPUB格式有問題,請向我報告問題。

4  暫時只支持博客園,其它的流行的博客有的有問題,待完整測試后再集成進去。寧可讓系統穩定,少一點功能,也不希望看到經常崩潰或是莫名奇妙的問題出現。

 

程序下載地址: Document Exporter

有好的建議或是問題報告,請加群或是給我寫郵件,謝謝支持。

 

1.1 版已經更新,請大家重新下載新的文件。

1.  可支持下載附件。如果文章中有附件,也會同時將附件下載到與文章相同的目錄中,當前支持格式為ZIP和RAR。

2.  目錄文本框可以選擇目錄。

3.  可支持下載取消。

 

 

 

出處:https://www.cnblogs.com/JamesLi2015/p/3151191.html


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM