1. 獲取操作tag
- 獲取操作tag的接種方式:
soup.find_all(name=None, attrs={}, recursive=True, text=None, limit=None, **kwargs)
,返回符合條件的所有標簽,查找不到則返回[],可以傳遞標簽名,標簽屬性,關鍵字參數,函數,True等soup.find(name=None, attrs={}, recursive=True, text=None, **kwargs)
,返回第一個符合條件的標簽,查找不到則返回Nonesoup.select(selector, _candidate_generator=None, limit=None)
,根據css選擇器返回所有符合條件的標簽soup.select_one(selector)
,返回符合css選擇器的第一個標簽
2. 操作tag
- tag.name ,獲取標簽名,例如:'div'
- tag['attr_name'] , 獲取標簽的某個屬性的值,string類型
- tag['class'] ,獲取標簽的class屬性值,list類型,例如:['orange', 'login']
- tag.attrs ,獲取標簽的所有屬性,dict類型
- tag.get_text() ,返回標簽的內容,或者 tag.text