都客仿站系列教程六:網站扒皮


所謂網站扒皮,就是下載網頁的前台文件和素材,用來制作成模板使用.簡單的講,使用cms可以快速搭建網站,因為目前很多cms都支持模板和功能分離.比如說你需要做一個網站,那么cms的功能已經滿足了,你只需要再按照模板制作規則制作成模板套用cms就可以了.

傳統的網站扒皮

1.自己手動保存需要的網頁,或者用火狐或者右鍵另存為,總之把html源文件弄下來.把圖片和js弄下來.

這個過程可以說是蛋疼.為什么這樣說呢.
問題1:經過瀏覽器解析后另存為的網頁並不是真正原有的網頁.
下載下來html頁面是經過瀏覽器解析了的.只要稍微懂一點div+css的就知道.css里面本來合並的寫法,比如:margin:0 20px;
下載后解析成了
margin-left:20px;
margin-right:20px;
margin-top:0px;
margin-bottom:0px;
稍微懂一點的就知道,客戶不滿意,因為冗余太多.
問題2.css中的背景沒法存取.
css中的素材不好處理.因為通過另存為是很難搞定的.很多聰明人都知道用firebug類似軟件.
問題3:編碼導致問題.
有這種情況,有時候另存到本機的網頁和原有網頁看起來一樣的.但是顯示出來效果不對,要么這里錯位了就是那里錯位了.我們檢查也檢查不出哪里有毛病.這種情況最可能就是編碼導致的問題.還有時候下載下來的用編輯器打開發現是亂碼.這是由於網頁的編碼和網頁文件本身的編碼不一致出現的問題.
 
2.html文件和素材都有了.該插入標簽制作成模板包了.
標簽很難記是個問題.如果沒有很好的操作習慣的話.一邊調試一邊插入標簽比較費勁. 
那么,我期望有那么一個軟件.相信也是大家希望的.
1.可以智能分析仿的目標網址,把原有的html文件和全部css,css里面的背景,網頁圖片和js,swf等全部一並下載下來.
2.可以智能分析鏈接地址.把路徑轉換成可以直接使用的.
3.可以100%保證和原有代碼一模一樣,模板css都沒有錯位.
4.可以批量把以前的編碼統一轉換,比如gb2312轉換成utf-8的文件格式.保證網頁編碼和網頁文件編碼一致.
或者,

最好可以有那么一個功能.可以批量下載頁面,不用一個一個下載.然后我再統一添加標簽制作模板. 

 


使用都客仿站高手進行網站扒皮 

 為了解決上面的種種問題,市面上的仿站產品應運而生了,什么模板小偷啦,整站下載器啦,還有國外的離線瀏覽器,我並不是覺得他們不好,實際上他們的下載功能還是很強大的,很多新手往往很向往,想用工具把別個的網站全部下載下來,我可以說不可能,除非你把別人的服務器破解了,直接下載源程序,如果是.net做的網站,那源程序還是編譯了的,拿到了也沒啥用.還是死心吧.

為什么整站下載也不好,你想啊,整個站亂七八糟的都下載了.而模板要求的就那幾個頁面,你得花更多的時間去清理那些不需要的東西.

本人用過市面所有的軟件.仍然不滿意,所以編寫了都客仿站高手這款軟件.(官方http://www.mou18.com) ,可以很負責人的說,這個是目前最好的仿站軟件.不只是下載和分析能力很強.還讓你擺脫修改鏈接和目錄的困擾.自動整理歸檔素材,清晰一目了然.你可以快速的制作模板了,把下載素材的活都省了.

簡單的算一下.就算仿站的熟手,要完成繁瑣的頁面抓取,也要花一兩天時間.而且,還不能保證css代碼和頁面兼容.比如css文件哪里有問題了.頁面變形了,這種情況是所有人的困擾.很可能搞了半天一點頭緒都沒有.如果用軟件那就一分鍾的事情.

 

好了,不說了,看看軟件怎么操作.

 我們以企業站:http://www.maticsoft.com/為例子.

我們到底需要下載哪些頁面作為模板頁?

 1.一般來說,對於企業站.模板頁面包含幾種類型:首頁,文章列表頁,文章詳細內容頁,單頁(比如關於我們).

那我們就按照一種類型下載一個頁面即可.


 

 那我們一個一個輸入並點擊下載以下頁面.

 首頁:http://www.maticsoft.com/default.htm

 列表頁: http://www.maticsoft.com/newslist.htm

 文章內容頁: http://www.maticsoft.com/News.aspx?id=36(任意下載一個內容頁)

 單頁:(任選一個下載)

 http://www.maticsoft.com/Products.aspx

 http://www.maticsoft.com/download.aspx 

 http://www.maticsoft.com/about.aspx 

 相似.結構都一樣.可以選一個下載.

 以上頁面.都只需要輸入網址和點擊下載按鈕即可.軟件會自動歸檔素材和修改html文件里面的素材引用位置.

 

 好了,打開來看看.直接在瀏覽器打開剛才下載的html文件就可以看到網站的前台html頁面和原來的一模一樣.

 

 這節課就學習到這里. 

 下一章我們將具體講解CMS的模板套用. 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM