花费 9 ms
HttpClient的使用-爬虫学习(一)

  Apache真是伟大,为我们提供了HttpClient.jar,这个HttpClient是客户端的http通信实现库,这个类库的作用是接受和发送http报文,引进这个类库,我们对于http的操作会 ...

Mon Dec 16 21:19:00 CST 2013 5 6921
HtmlParser的使用-爬虫学习(三)

  关于这个HtmlParser的学习资料,网上真的很匮乏,这个好用的东西不要浪费啊,所以我在这里隆重的介绍一下。   HtmlParser是一个用来解析HTML文件的Java包,主要用于转换盒抽取 ...

Thu Dec 19 23:56:00 CST 2013 7 2140
MD5算法-爬虫学习(五)

  在实现爬虫的时候,我们使用Hash结构去存储我们用过的URL的时候,有些URL可能长度很长,为了更加节省空间,我们就要对URL进行压缩,帮它减减肥,这个我们介绍这个MD5算法,可以对URL进行有效 ...

Fri Jan 03 08:04:00 CST 2014 6 2044

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM