//若需要抓取的節點有ID,類似“<div id='post_list'>value</div>”這種,那很簡單只需調用GetElementbyId方法根據節點ID即可獲 取所需節點。從而通過HtmlNode中的InnerText或Attribute屬性來獲取你想要的值。
//實例化HtmlAgilityPack.HtmlDocument對象
HtmlDocument doc =
new
HtmlDocument();
//載入HTML
doc.LoadHtml(str);
//根據HTML節點NODE的ID獲取節點
HtmlNode navNode = doc.GetElementbyId(
"post_list"
);
|
其他可能有用的技術點:
1、獲取網頁title:doc.DocumentNode.SelectSingleNode("//title").InnerText;
解釋:XPath中“//title”表示所有title節點。SelectSingleNode用於獲取滿足條件的唯一的節點。
2、獲取所有的超鏈接:doc.DocumentNode.Descendants("a")
3、獲取name為kw的input,也就是相當於getElementsByName():
var kwBox = doc.DocumentNode.SelectSingleNode("//input[@name='kw']");
//若需要抓取的節點有ID,類似“<div id='post_list'>value</div>”這種,那很簡單只需調用GetElementbyId方法根據節點ID即可獲 取所需節點。從而通過HtmlNode中的InnerText或Attribute屬性來獲取你想要的值。
|