網站的整站抓取並存為pdf,chm方法


因為有些時候,我們希望把網頁的上的精彩資料保存下來。在我們不上網的情況下也能使用這些資料手冊。這時,我們想到把它們下載回來,並轉為其它我們可以方便瀏覽的格式。這里講一下幾個軟件的使用,因為使用它們,你就可以很簡便的實現單個網頁以至整個網站的下載,並將它們存為pdf,chm格式。

 

此處下載網站http://www.cocos2d-x.org/reference/native-cpp/modules.html作為例子。

image

 

一、Adobe Acrobat 8 Professional

這個軟件本來是收費軟件,但是我們都是下載破解版的孩子。。下載回來,找個注冊機注冊一下,就可以了。這個強大工具,它不僅可以抓取網頁還可以實現pdf的編輯,合並,導出為word 格式等。這里主要說一下它怎么抓取。

1、你安裝完后,會看到下圖

image

2、你點擊創建pdf,然后選擇從網站創建pdf

image

3、從網頁創建pdf,需要輸入URL,即你要下載的網頁或網站地址。這里獲取第幾層,說的是從這個網頁開始你要下挖掘的深度。當你獲取三層的時候,它已經會下載較多的資源並占用較多的空間。(注:你設置僅獲取1層代表你要下載的是單個網頁,一般我們下載的是該網頁,及該網頁內所有超鏈接網頁,此時我們獲取2層)

image

4、創建后,你就可以獲得相應的pdf,你保存即可。因為它並不是下載回來就立即保存在本地的,所以如果中途軟件出現無法響應一類的錯誤時,你辛辛苦苦下載的pdf將要重新下載。所以下載兩層是比較好的選擇。你可以在下載回來以后再決定哪些頁面或者書簽需要追加鏈接到當前文檔里。

對某個書簽追加到下一層(只要單擊右鍵,即可看到選擇):

image

當然你也可以對某個頁面實行追加當前頁面的所有鏈接到下一層。找到該頁面。選擇菜單欄中的高級->網頁捕捉->追加頁面上的所有鏈接

image

5、你可以對你的pdf進行注釋,修改,刪除某些頁。這些操作都是比較簡單的,就不多說了。

6、到此,你就可以輕松的擁有自己的本地幫助文檔了。有時候它下載回來的頁面會有些變形不太好看,但是主要的東西,還是看的比較清楚的,而且它還會在抓取的時候,自動幫你編輯便簽,方便你的查看。效果圖如下:

image

image

二、WebZIP+htm2chm

1、它們兩都很好下載,在華軍軟件園一類就可以下載到了。下載回來,是可以直接使用的exe文件。

2、先用webzip把網站下載回來。打開webzip->文件->創建新工程->

image

按要求填寫完信息即可完成創建,按立即執行就會開始下載該網站。

當然,你也可以在后繼連接那里設置跟蹤鏈接級別來決定你要下載的網站的大小,如果你想整站下載,就默認設置就可以了。你在下載的時候可以隨時暫停下載,而你已經下載的頁面和信息不會因為你的軟件出現問題而需要您自己重新下載。因為這個下載回來就是html,所以基本能保持網頁原貌。

image

image

現在你已經可以直接查看這個網站而不需要上網了,但是如果你的網站比較龐大,那么用這個軟件進行查看會比較耗時間,准確來說就是它反應有點慢。

下面,我們把它制作成chm文件。

打開htm2chm.exe

image

編譯->設置編譯器(找到你要做主頁的頁面,其它信息會自動填寫,輸出處填寫的是你想把編輯好的chm輸出到哪個文件夾里)->開始

image

稍等一會,你就會得到你想要的chm文檔

image


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM