Python 抓取網頁tag操作


1. 獲取操作tag

  • 獲取操作tag的接種方式:
  1. soup.find_all(name=None, attrs={}, recursive=True, text=None, limit=None, **kwargs),返回符合條件的所有標簽,查找不到則返回[],可以傳遞標簽名,標簽屬性,關鍵字參數,函數,True等
  2. soup.find(name=None, attrs={}, recursive=True, text=None, **kwargs),返回第一個符合條件的標簽,查找不到則返回None
  3. soup.select(selector, _candidate_generator=None, limit=None),根據css選擇器返回所有符合條件的標簽
  4. soup.select_one(selector),返回符合css選擇器的第一個標簽

2. 操作tag

  • tag.name ,獲取標簽名,例如:'div'
  • tag['attr_name'] , 獲取標簽的某個屬性的值,string類型
  • tag['class'] ,獲取標簽的class屬性值,list類型,例如:['orange', 'login']
  • tag.attrs ,獲取標簽的所有屬性,dict類型
  • tag.get_text() ,返回標簽的內容,或者 tag.text


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM