//若需要抓取的節點有ID,類似“<div id='post_list'>value</div>”這種,那很簡單只需調用GetElementbyId方法根據節點ID即可獲 取所需節點。從而通過HtmlNode中的InnerText或Attribute屬性來獲取你想要的值。 //實例化HtmlAgilityPack.HtmlDocument對象 HtmlDocument doc = new HtmlDocument(); //載入HTML doc.LoadHtml(str); //根據HTML節點NODE的ID獲取節點 HtmlNode navNode = doc.GetElementbyId("post_list");
其他可能有用的技術點:
1、獲取網頁title:doc.DocumentNode.SelectSingleNode("//title").InnerText;
解釋:XPath中“//title”表示所有title節點。SelectSingleNode用於獲取滿足條件的唯一的節點。
2、獲取所有的超鏈接:doc.DocumentNode.Descendants("a")
3、獲取name為kw的input,也就是相當於getElementsByName():
var kwBox = doc.DocumentNode.SelectSingleNode("//input[@name='kw']");