HtmlAgilityPack 屬性獲取


//若需要抓取的節點有ID,類似“<div id='post_list'>value</div>”這種,那很簡單只需調用GetElementbyId方法根據節點ID即可獲 取所需節點。從而通過HtmlNode中的InnerText或Attribute屬性來獲取你想要的值。
 
 
 
                //實例化HtmlAgilityPack.HtmlDocument對象
                HtmlDocument doc = new  HtmlDocument();
                //載入HTML
                doc.LoadHtml(str);
 
                //根據HTML節點NODE的ID獲取節點
                HtmlNode navNode = doc.GetElementbyId( "post_list" );

 

其他可能有用的技術點:
1、獲取網頁title:doc.DocumentNode.SelectSingleNode("//title").InnerText; 
解釋:XPath中“//title”表示所有title節點。SelectSingleNode用於獲取滿足條件的唯一的節點。


2、獲取所有的超鏈接:doc.DocumentNode.Descendants("a")


3、獲取name為kw的input,也就是相當於getElementsByName():
            var kwBox = doc.DocumentNode.SelectSingleNode("//input[@name='kw']");

 

//若需要抓取的節點有ID,類似“<div id='post_list'>value</div>”這種,那很簡單只需調用GetElementbyId方法根據節點ID即可獲 取所需節點。從而通過HtmlNode中的InnerText或Attribute屬性來獲取你想要的值。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM