Python爬蟲小白入門(十三)Python 爬蟲 – 使用CSS選擇器


BeautifulSoup對象支持使用CSS選擇器查找標簽。這些選擇器是CSS語言中使用的指定HTML Tag樣式的方式。

下面是一些例子:

  • p a — 在p標記中找到所有的a標簽。
  • body p a — 在body標記內的p標記內查找所有a標簽。
  • html body — 查找html標記內的body標簽。
  • p.outer-text — 查找帶有類是outer-text所有p標記。
  • p#first — 查找id為first的所有p標簽。
  • body p.outer-text — 在body標記中查找類是outer-text的p標簽。

使用CSS選擇器查找標簽,可以使用select方法:

import requests
from bs4 import BeautifulSoup

page = requests.get("https://kevinhwu.github.io/demo/python-scraping/simple2.html")
soup = BeautifulSoup(page.content, 'html.parser')

soup.select("div p")

輸出

[<p class="inner-text first-item" id="first">
First paragraph.
</p>, <p class="inner-text">
Second paragraph.
</p>]

注意,上面的select方法返回一個BeautifulSoup對象列表,就像findfind_all一樣。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM