介紹
網絡爬蟲(又稱為網頁蜘蛛,網絡機器人,在FOAF社區中間,更經常的稱為網頁追逐者),是一種按照一定的規則,自動地抓取萬維網信息的程序或者腳本。另外一些不常使用的名字還有螞蟻、自動索引、模擬程序或者蠕蟲。
背景
最近在玩爬蟲,但是發現基本都是python的資料居多。如今代碼圈很多做網絡爬蟲的例子,這里給大家分享的是如何用C#做網絡爬蟲。注意這里的分享只是分享思路和遇到的一些問題,並不是一整個例子,因為如果要講解一整個例子的話,牽扯的東西太多。
文章列表
1、用C#+Selenium+ChromeDriver 爬取網頁,完美模擬真實的用戶瀏覽行為
2、C#爬蟲-Selenium ChromeDriver 設置代理
3、從內存中釋放Selenium chromedriver.exe
4、c#爬蟲-從內存中釋放Selenium chromedriver.exe終極殺
5、c#爬蟲-selenium檢測webdriver封爬蟲的解決方法
希望對大家有幫助。