关于python中selector问题

本文转载自查看原文 2019-01-17 10:34 730 python

在做大型的爬虫时，re表达式往往效率不高，scrapy框架为爬虫提供了很好的爬虫方法

scrapy提取数据时有一套自己的机制，即selectors，一般通过特定的XPath，或者特定

的CSS表达式来进行提取HTML中的部分。

Xpath使用在XML文档中，用来对文档中的元素和属性历遍，此时XML时被当作节点树

来对待，它包括元素、属性、文本、命名空间、处理指令、注释、根节点（文档节点）

xpath使用表达路径在xml文档中选取节点

nodename:选取此节点的所有子节点

/：从根节点选取

//：从匹配选择的当前节点选择文档中的节点，不考虑位置

.：选取当前节点

..：选取

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 python之select与selector jquery中not的用法[.not(selector)] OC中的selector epoll 浅析以及 nio 中的 Selector Object-C 中的Selector 概念 Android中Selector的setSelected“方法不管用” Python中hash的问题 python中编码问题 Python中的路径问题 Python爬虫之Selector的基本用法正确运用方法，案例详解