花费 6 ms
动态爬虫——selenium2搭载phantomjs入门范例

这是我学习爬虫比较深入的一步了,大部分的网页抓取用urllib2都可以搞定,但是涉及到JavaScript的时候,urlopen就完全傻逼了,所以不得不用模拟浏览器,方法也有很多,此处我采用的是sel ...

Fri Jun 06 23:03:00 CST 2014 3 22636
静态页面爬虫

这是某个大作业的总结,但是涵盖了所有静态页面爬虫的种类,绕过验证码、防ip被封等等,所以贴在了这里。 若要了解模拟登录及验证码,请直接往下拽,至第二幅图片下面 ------------------ ...

Sat May 31 18:01:00 CST 2014 2 1891

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM