用Teleport Ultra下載網站全部頁面 爬蟲


測試case,就是把Commons-FileUpload 的API下載來

Snap20
 
上網查的時候我才發現這是一個由很多頁面組成的網站,下載起來很麻煩。
Snap26
 
怎么辦呢?呵呵,一定是有辦法的。Teleport Ultra這個工具就能幫我們搞定!
這是一個漢化綠版的迅雷下載鏈接: thunder://QUFodHRwOi8vMS5jcWR4MS5jcnNreS5jb20vMjAwOTAzL1RlbGVwb3J0VWx0cmEtdjEuNTlILnppcFpa  大小只有759K。
下載完成后解壓縮,直接運行ultra.exe,然后選擇 文件-新建項目向導
Snap19
 
第一步這里選擇第二項:復制一個網站,包含該網站的目錄結構。
Snap27
 
第二步 啟始地址填剛才網頁的地址: http://commons.apache.org/fileupload/apidocs/index.html
並且指定Teleport的搜索深度為6曾鏈接。
Snap28
 
為什么填6呢?細心的朋友應該能發現,最深層Package(包)中的Class(類)的鏈接是 http://commons.apache.org/fileupload/apidocs  后6層鏈接。
Snap29
 
第三步 這里選擇網頁中媒體,因為是API,我們就直接選擇 僅文本。
Snap30
 
第四步 來確定一下,我們剛剛建的項目。這里有提示,點擊開始按鈕以運行該項目。
Snap31
 
然后,選擇一個目錄來保存我們剛剛建好的項目,以及網站頁面的下載地址。
Snap32
 
點擊開始來啟動項目吧。
Snap33
 
這是項目進行中,我們能看到,網站結構也被下載到本地。
Snap34
 
底部有顯示信息,我們能了解到項目的進行狀況。
Snap35
Snap36 
 
下載好的就是這樣的,一個Teleport Ultra的.tpu項目文件,還有就是網站的頁面目錄。
Snap37
Snap38
 
激動人心的時刻到了,去瀏覽器中訪問吧。
Snap39
 
這樣一來,不僅僅是Commons-FileUpload的API我們能下載到本地,幾乎任何官方API我們都有了辦法,JDK,MySQL等等。
現在我們下載的API是頁面目錄,我會繼續努力,爭取制作成CHM格式的API文檔。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM