find_all()簡單說明:
find_all()
find_all() 方法搜索當前tag的所有tag子節點,並判斷是否符合過濾器的條件
用法一:
rs=soup.find_all('a')
將返回soup中所有的超鏈接內容
類似的還有rs.find_all('span')、rs.find_all('title')、rs.find_all('h1')
也可加入查找條件,eg:
rs.find_all('img',{'class':'news-img'})
將返回所有的class屬性為news-img的img內容
用法二:
這里的true指的就是選中所有有id這個屬性的標簽
soup.find_all(id=True)
返回結果:
[<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>, # <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>, # <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]
用法三:
soup.find_all("a", string="Elsie")
通過 string 參數可以搜搜文檔中的字符串內容.與 name 參數的可選值一樣, string 參數接受 字符串 , 正則表達式 , 列表, True
用法四:
soup.find_all("a", limit=2)
limit即為查找的數量,此處查找數量為兩次