xpath獲取下一頁,兄弟節點的妙用

本文轉載自查看原文 2018-03-29 19:12 4193 Python

第一頁的情況:

第四頁的情況 :

文章的鏈接: http://tech.huanqiu.com/science/2018-02/11605853_4.html

從上面我們可以看到,如果僅僅用xpath獲取下一頁的鏈接例如: //div[@id="pages"]/a[@class="a1"][text()="下一頁"]/@href

就會在第四頁的時候重復獲取相同的鏈接,我們通過觀察可以發現一些規律:

所在的頁碼是在與鏈接a標簽同級的span標簽里面,這個時候我們可以采用兄弟結點,來解決這個問題,

//div[@id="pages"]/span/following-sibling::a[text()!="下一頁"]/@href

說明:

1 獲取到span標簽的下一個兄弟結點a標簽 (following-sibling::a)

2 尋找它的text內容不為"下一頁" ([text()!="下一頁"])

3 再取這個a標簽的href屬性 (@href)

這樣在第四頁的時候獲取到的鏈接為Null , 就不會重復獲取下一頁的鏈接了

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python爬蟲獲取下一頁 Android ListView上拉獲取下一頁 Scrapy中如何獲取下一頁鏈接上一頁下一頁 xpath獲取當前標簽的兄弟節點，父節點(轉) xpath獲取當前標簽的兄弟節點，父節點(轉) 織夢欄目列表頁分頁條獲取上一頁下一頁鏈接 linux more 上一頁，下一頁 Vue 點擊進入下一頁,下一頁從頂部開始安卓分頁顯示數據（上一頁和下一頁）