2.2 Xpath-helper (chrome插件) 爬蟲、網頁分析解析輔助工具


1. Xpath-helper下載

可以直接在chrome瀏覽器中的擴展程序搜索 Xpath-helper進行添加

也可以直接在http://www.chromein.com/crx_11654.html  ,選擇本站下載,並進行添加。

2.Xpath-helper使用

安裝好之后,我們重新打開瀏覽器,按ctrl+shift+x就能調出xpath-helper框

 

 

如果我們要查找某一個、或者某一塊元素的xpath路徑,可以按住shift,並移動到這一塊中,上面的框就會顯示這個元素的xpath路徑,右邊則會顯示解析出的文本內容,並且我們可以自己改動xpath路徑,程序也會自動的顯示對應的位置,可以很方便的幫助我們判斷我們的xpath語句是否書寫正確。

雖然這個小插件使用非常方便,但它也不是萬能的,有兩個問題:

1.XPath Helper 自動提取的 XPath 都是從根路徑開始的,這幾乎必然導致 XPath 過長,不利於維護;

2.當提取循環的列表數據時,XPath Helper 是使用的下標來分別提取的列表中的每一條數據,這樣並不適合程序批量處理,還是需要人為修改一些類似於*標記等。

 

2.在開發者工具:右擊已選字段,點擊Copy XPath即可將該字段的XPath保存到瀏覽器剪貼板上,如下圖所示:

 

 

3、在XPath中,如果使用class屬性來定位元素,最好使用contains函數,因為元素可能含有多個class

{
    name: "article_publish_time", selector: "//span[contains(@class,'date')]/span" },


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM