Net處理html頁面元素工具類(HtmlAgilityPack.dll)的使用


簡介

本文介紹net處理html頁面元素的工具類(HtmlAgilityPack.dll)的使用,用途比較多的應該是例如采集類的功能,采集到的html字符串要怎樣處理是一個頭痛的問題,如果是截取就太麻煩了而且容易出錯。所有就用到本文的第三方dll來處理了。

 

下載

下載地址:http://htmlagilitypack.codeplex.com/

點擊“download”按鈕直接下載。

 

使用

1.添加HtmlAgilityPack.dll引用(引用類using HtmlAgilityPack;)。

2.簡單根據html中input的id獲取value代碼如下:

// 模擬用戶請求
WebClient webClient = new WebClient();
webClient.Encoding = System.Text.Encoding.UTF8;
string htmlContext = webClient.DownloadString("http://stone_w.cnblogs.com/");
webClient.Credentials = CredentialCache.DefaultCredentials; // 添加授權證書
webClient.Headers.Add("User-Agent", "Microsoft Internet Explorer");
webClient.Headers.Add("Host", "www.cnblogs.com");

// 獲取html元素(htmlContext為html頁面字符串)
HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(htmlContext);  // 加載html頁面
HtmlNode navNode = htmlDoc.GetElementbyId("id名稱");
Response.Write(navNode.Attributes["value"].Value);

 

總結

HtmlAgilityPack可以根據id查詢value,還可以獲取單個元素節點,都是HtmlDocument類的內置方法,大家可以試着練。謝謝完~

 

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM