防采集的幾種方法


經過各種搜索及自己的試驗,決定后面做防采集通過混用以下方法來解決,當然采集是無法完全防止的,只能是盡量減少。

基本方法如下:

  1. 首先簡單限制右鍵、復制等手工獲取方法

  2. referer,內容gzip/deflate壓縮等常用方法

  3. 內容混淆,加入隨機\0截斷,加入背景色隨機版權文字

  4. 需要防采集的內容:隨機token+AJAX獲取動態加密后的內容,然后使用JS解密

  5. 較特殊的方法,亂序輸出HTML標簽及內容,通過JS進行正常排除並輸出,實際上可以合並到上一點

  6. 由於采集一般不采集JS,圖片等內容,因此使用JS或圖片記錄IP,與頁面IP進行時間差比對等處理。

  7. 數據分析出采集IP動態封鎖,當然也可手工封IP

混用以上功能,一般采集的人就煩死了,估計也不會繼續采集。

對搜索引擎的影響,可以通過關鍵字、簡介等方式盡量降低,主要取決於你對防采集與搜索引擎的權衡。

各位覺得有什么更好的方法的可以討論下~


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM