經過各種搜索及自己的試驗,決定后面做防采集通過混用以下方法來解決,當然采集是無法完全防止的,只能是盡量減少。
基本方法如下:
-
首先簡單限制右鍵、復制等手工獲取方法
-
referer,內容gzip/deflate壓縮等常用方法
-
內容混淆,加入隨機\0截斷,加入背景色隨機版權文字
-
需要防采集的內容:隨機token+AJAX獲取動態加密后的內容,然后使用JS解密
-
較特殊的方法,亂序輸出HTML標簽及內容,通過JS進行正常排除並輸出,實際上可以合並到上一點
-
由於采集一般不采集JS,圖片等內容,因此使用JS或圖片記錄IP,與頁面IP進行時間差比對等處理。
-
數據分析出采集IP動態封鎖,當然也可手工封IP
混用以上功能,一般采集的人就煩死了,估計也不會繼續采集。
對搜索引擎的影響,可以通過關鍵字、簡介等方式盡量降低,主要取決於你對防采集與搜索引擎的權衡。
各位覺得有什么更好的方法的可以討論下~