讀秀(www.duxiu.com)電子書下載器


讀秀上有很多電子書,不過只能以在線圖片形式瀏覽,所以寫了一個下載器可以把圖片批量下載到本地。下載器需要.Net framework 4.5。

讀秀有兩種方式閱讀電子書,一種是全文瀏覽,一般來說如果你是在高校,並且學校已經買了讀秀的包庫權限,那么你就可以訪問到電子書的全文。另一種是咨詢瀏覽,每次只能通過讀秀發給你的郵件里面的鏈接瀏覽電子書的一部分。不過可以通過多次咨詢來瀏覽全文,比如第一次咨詢1-50頁,第二次咨詢51-100頁,...

讀秀網站是需要賬號才能進入,可以搜索一下,網上有很多共享出來的賬號。淘寶也有便宜的一兩塊錢的讀秀入口。

下載器集成了一個瀏覽器控件(輸入完網址后,點擊Go button),可以通過下載器導航到電子書閱讀頁面,網址記得要加http://的前綴,

 

 

當導航到電子書瀏覽頁面,Download button自動變為enable,

 

 

點擊Download button后,會在應用程序目錄下生成一個Download子目錄,當前電子書的所有圖片都會保存進去,下載過程中可以看到Download目錄中不斷有圖片文件生成。因為讀秀加入了防機器人檢測,所以在下載過程中需要輸入驗證碼,而且有時候需要輸入很多次。下載過程中,當發現界面上出現圖片時,在后面的textbox輸入圖片的文字然后點Go button。

 

當下載完成后會彈出Done消息。

 

Dwonload文件夾里面所有文件的命名規則是:

A-1...n 封面

B-1...n 書名頁

C-1...n 版權頁

D-1...n 前言

E-1...n 目錄

F-1...n 正文頁

G-1...n 附錄頁

H-1...n 封底

如果你有權限瀏覽全文,那么一次下載就可以下完整本書。

如果是咨詢方式的話需要多次下載才能下載完整本書。當多次下載時不用重命名已下載文件,下載器會自動知道當前正在下載哪一頁,並以頁數作為文件名。

 

當下載完所有圖片就可以自己制作pdf文件。下載器也提供了一個簡單的pdf文件生成功能,pdf button會將Download文件夾里面所有圖片文件合並成一個名叫Book.pdf的文件(同樣保存在Download目錄)。

 

下載器引用了兩個lib,一個是Jurassic,用來解析javascript代碼。一個是iTextSharp,生成pdf文件。

源代碼一並附上。

http://files.cnblogs.com/ghczzz/NavigatedDownloaderSource.zip

http://files.cnblogs.com/ghczzz/NavigatedDownloader.zip


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM