Python爬蟲小白入門（十三）Python 爬蟲 – 使用CSS選擇器

本文轉載自查看原文 2020-06-22 11:11 854 python之爬蟲

BeautifulSoup對象支持使用CSS選擇器查找標簽。這些選擇器是CSS語言中使用的指定HTML Tag樣式的方式。

下面是一些例子:

p a — 在p標記中找到所有的a標簽。
body p a — 在body標記內的p標記內查找所有a標簽。
html body — 查找html標記內的body標簽。
p.outer-text — 查找帶有類是outer-text所有p標記。
p#first — 查找id為first的所有p標簽。
body p.outer-text — 在body標記中查找類是outer-text的p標簽。

使用CSS選擇器查找標簽，可以使用select方法：

import requests
from bs4 import BeautifulSoup

page = requests.get("https://kevinhwu.github.io/demo/python-scraping/simple2.html")
soup = BeautifulSoup(page.content, 'html.parser')

soup.select("div p")

輸出

[<p class="inner-text first-item" id="first">
First paragraph.
</p>, <p class="inner-text">
Second paragraph.
</p>]

注意，上面的select方法返回一個BeautifulSoup對象列表，就像find和find_all一樣。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 小白學 Python 爬蟲（35）：爬蟲框架 Scrapy 入門基礎（三） Selector 選擇器【Python爬蟲】用CSS 選擇器提取網頁數據 python爬蟲——BeautifulSoup詳解（附加css選擇器） Python爬蟲 XPath 選擇器詳解 Python爬蟲從入門到放棄（十四）之 Scrapy框架中選擇器的用法 Python爬蟲(十三)_案例：使用XPath的爬蟲 Python 爬蟲從入門到進階之路（十三） Python爬蟲小白入門（二）requests庫 Python爬蟲小白入門（三）BeautifulSoup庫 python css選擇器