标签【信息采集】

c#控制IE浏览器自动点击等事件WebBrowser，mshtml.IHTMLDocument2

可以实现例如通过应用程序操作google搜索，用户输入要搜索的内容，然后在google中搜索；可以自动点击网页上的按钮等功能 1. 加入对Microsoft Internet Control ...

引言最近项目有需求从一个老的站点抓取信息然后倒入到新的系统中。由于老的系统已经没有人维护，数据又比较分散，而要提取的数据在网页上表现的反而更统一，所以计划通过网络请求然后分析页面的方式来提取数据。 ...

交换机配置： int g1/0/0 un sh int vlani 1 ip add 192.168.56.177 q stel s e user-i v 4 auth aaa pro in ...

目录：信息采集入门系列目录下面记录的是我自己整理的C#请求页面核心类，主要有如下几个方法 1.HttpWebRequest Get请求获得页面html 2.HttpWebRequest Post请求获得页面html 3.模拟登录获得cookie内容 4.模拟登录获得cookie字符串 ...

nutch 抓取需要登录的网页

　　题记：一步一坑，且行且珍惜　　最近接到任务，要利用nutch去抓取公司内部系统的文章，可是需要登录才能抓到。对于一个做.net，不熟悉java，不知道hadoop，很少接触linux的我，这个 ...

C#读取RSS源，并利用Solr索引

　　折磨我几天的问题今天终于解决了，分享一下近期solr使用的一些经验。本来是用nutch在爬取页面，可是客户需要爬取RSS，而且可以识别那些页面是通过RSS源抓取出来的。nutch虽然 ...

相关标签