Web偵察工具HTTrack (爬取整站)
HTTrack介紹
爬取整站的網頁,用於離線瀏覽,減少與目標系統交互,HTTrack是一個免費的(GPL,自由軟件)和易於使用的離線瀏覽器工具。它允許您從Internet上下載萬維網站點到本地目錄,遞歸地構建所有目錄,從服務器獲取HTML,圖像和其他文件到您的計算機。HTTrack安排原始網站的相關鏈接結構。只需在瀏覽器中打開“鏡像”網站的頁面,即可從鏈接到鏈接瀏覽網站,就像在線查看網站一樣。HTTrack也可以更新現有的鏡像站點,並恢復中斷的下載。HTTrack完全可配置,並具有集成的幫助系統。
HTTrack使用
1.先創建一個目錄,用來保存爬下來的網頁和數據
root@kali:~# mkdir dvwa
2.打開Httrack
root@kali:~# httrack
3.給項目命名
Enter project name :dvwa
4.保存到哪個目錄
Base path (return=/root/websites/) :/root/dvwa
5.網站的url
Enter URLs (separated by commas or blank spaces) :http://192.168.14.157/dvwa/
6.
Action:
(enter)
1 Mirror Web Site(s)
2 Mirror Web Site(s) with Wizard
3 Just Get Files Indicated
4 Mirror ALL links in URLs (Multiple Mirror)
5 Test Links In URLs (Bookmark Test)
0 Quit
:2
//1:直接鏡像站點
//2:用向導完成鏡像
//3:只get某種特定的文件
//4:鏡像在這個url下所有的鏈接
//5:測試在這個url下的鏈接
//0:退出
7.是否使用代理
8.你可以定義一些字符,用來爬特定類型的數據,我們全部類型數據都爬得話,設置*
9.設置更多選項,使用help可以看到更多選項,我們默認,直接Enter
10.開始爬站
11.查看結果