爬蟲：網頁里元素的xpath結構，scrapy不一定就找的到

本文轉載自查看原文 2017-11-17 10:07 1379 python爬蟲系列/ 爬蟲爬到的DOM結構和瀏覽器里看到的不一致原因剖析

這種情況原因是html界面關聯的js文件可能會動態修改DOM結構，這樣瀏覽器完成了動態修改DOM，在瀏覽器上看到的DOM結構，就和后台抓到的DOM結構不通

舉例：新浪微博發的微博，在瀏覽器通過firebug的插件FirePath可以很容易計算出xpath

通過Firefinder可以查看xpath的匹配情況

但是查看頁面的源代碼，可以發現，微博的內容都是包含在js里的FM.view里的，這些會被js動態生成DOM，但是抓取返回的內容都是下面這些內容，是還沒有生成DOM的

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 你不一定懂的cpu顯示信息【你不一定知曉的】C#取消異步操作如何高效的遍歷Map？你常用的不一定是最快的多線程也不一定比單線程快你不一定知道的幾個前端小知識 [數學] 可導函數的導函數不一定連續實習筆記-2：sql 分組不一定要group by Ubuntu 16.04安裝QQ（不一定成功） 3306端口不通，不一定是網絡的問題網頁爬蟲--scrapy進階