Nginx的防爬蟲優化

本文轉載自查看原文 2018-03-27 11:36 971 Nginx

我們可以根據客戶端的 user-agents 首部字段來阻止指定的爬蟲爬取我們的網站：

虛擬主機配置如下：（紅色標記為添加或者修改內容）

[root@Nginx www_date]# cat brian.conf 
    server {
        listen       80;
        server_name  www.brian.com;
    　　 if ($http_user_agent ~* "qihoobot|Baiduspider|Googlebot|Googlebot-Mobile|Googlebot-Image|Mediapartners-Google|Adsbot-Google|Yahoo! Slurp China|YoudaoBot|Sosospider|Sogou spider|Sogou web spider|MSNBot") {
         　　return 403; 　　　　　　}
        location / {
            root   html/brian;
            index  index.html index.htm;
            #limit_conn addr 1;
        limit_conn perserver 2;
        auth_basic    "brian training";
        auth_basic_user_file  /opt/nginx/conf/htpasswd;
            
        }
    location ~ .*\.(js|jpg|JPG|jpeg|JPEG|css|bmp|gif|GIF)$ {
        access_log off;
    }
        access_log logs/brian.log main gzip buffer=128k flush=5s; 
        error_page   500 502 503 504  /50x.html;
        location = /50x.html {
            root   html;
        }
 }

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Nginx防爬蟲優化 Nginx防蜘蛛爬蟲處理 Nginx優化防爬蟲限制http請求方法 CDN網頁加速架構優化監牢模式控制並發量以及客戶端請求速率爬蟲防封IP [ Crawler ] 爬蟲防屏蔽技巧知乎爬蟲之5:爬蟲優化前端優化防抖與節流 nginx 防ddos，cc攻擊上 nginx防攻擊的簡單配置 Nginx基本優化一