信息收集之網站鏡像克隆


前言

一個成功的滲透測試人員,在進行一次成功的滲透測試之前,必須能夠獲得盡可能多的信息。有時候復制組織的整個網站進行離線評估更有效。這可以使用自動化工具設定搜索條件,或者僅對當前站點改變的敏感信息進行鏡像復制。當離線時,擁有 一份鏡像進行持續觀察很有效。Wooyun被封殺,現在網上還有很多Wooyun鏡像站來繼續發揮Wooyun的預熱那樣。鏡像網站不會復制動態內容,也不會復制網站的中間件,比如:數據庫等,因此,這並不是對所有滲透測試環境都適用。我個人一般都是用這些工具來 "盜取" 炫酷的html5網站(噓 ~~~),有時候用它離線存儲一些網站,總之挺實用的。

使用wget復制克隆網站

介紹

Kali linux默認按照了wget工具,它簡單使用,Pentest Box中也集成了wget。只要在終端下敲幾個命令,就可以下載整個網站的html文件。wget不能復制服務器的程序頁面,例如PHP腳本頁面。

使用方法

終端下輸入:

wget -m -p -E -k -K -np -v http://www.baidu.com

這樣就會把百度的首頁復制下來,就是這么簡單粗暴。這里使用了一連串的參數,可以使用man命令來查看 wget的手冊:

man wget

wget的主要參數如下:

m:鏡像,選擇該選項適用於Web站點    
p頁面獲先決條件,該選項確保 包含了請求的   圖片和css腳本文件被下載(這樣可以更好的復制 html5的站點)  
E:適用擴展,這可以在本地另存為一個html文件  
k:轉換鏈接,確保文件被轉換,用於本地瀏覽  
K:轉換備份文件,將會以orig為后綴作為原始文件    

從組織的Web服務器傳送的文件將會存儲在復制的網站名稱命名的文件夾中。復制網站時,可能會發生錯誤,尤其是在復制動態腳本頁面的時候,這是因為生成頁面的大部分代碼是有動態腳本創建的,大部分站點的應用程序是不能訪問到的。

注:文件一旦被下載,切忌不可以讓其他人瀏覽和重新發布站點,這回違反版權法。

實戰克隆

下面來 實戰用wget來克隆 小米官方HTML5引導頁:

使用HTTrack復制克隆網站

介紹

HTTrack是一款免費的離線瀏覽器工具,和wget克隆復制鏡像差不多,從服務器抓取HTML文件、圖片、以及其他css文件並存儲到你的計算機上。Kali 2.0起默認預裝了 HTTrack

使用方法

終端下輸入:

httrack

如果沒有安裝這個工具的話,那就現場安裝一下吧,只需要2個命令:

apt-get update
apt-get install httrack

這里提示要輸入項目名稱、存放網站的路徑(默認為 /root/website) 和要克隆的目標站 我們這里以 搜狗瀏覽器官網為例
我們自定義輸入test 然后 按下 回車

sougou

然后默認路徑 回車

輸入想要克隆的網站

http://ie.sougou.com

下面HTTrack提供了一些選項,我們一般選擇第二本選項 Mirror Web Site(s) with Wizard(具有向導遞歸層級的鏡像網站) 輸入:2
回車 回車 回車 后面的一些基本設置 一般一直回車下去 直到網站開始克隆為止,HTTrack 就開始進行網站克隆了。

小結

個人認為:wget操作簡單方便,但是克隆效果不及 HTTrack;HTTrack雖然比wget稍微繁瑣了一點,但是在爬一個大型網站上面完整性要優於wget。 對了,最后再提醒一下:注意版權。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM