爬蟲遇到的坑——發現你是爬蟲拋出假數據


在爬取國外的某個網站的時候,剛開始他們是封ip,優化好ip池,准備大展身手的時候,數據順利的爬取完畢后,發現數據有重復的。然后研究了一下,

最后的原因是他們的后台發現是爬蟲以后,直接給拋出假的數據。上證據:

 

 

 

 

 

 

 

 

 

解決辦法:

每個ip的訪問次數盡量的少,盡量用多的ip抓取,抓取速度盡量的慢一些。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM