find_all的用法 Python(bs4,BeautifulSoup)


find_all()简单说明:

find_all()

find_all() 方法搜索当前tag的所有tag子节点,并判断是否符合过滤器的条件

用法一:

rs=soup.find_all('a')

将返回soup中所有的超链接内容

类似的还有rs.find_all('span')、rs.find_all('title')、rs.find_all('h1')

也可加入查找条件,eg:

rs.find_all('img',{'class':'news-img'})

将返回所有的class属性为news-img的img内容

用法二:

这里的true指的就是选中所有有id这个属性的标签

soup.find_all(id=True)

返回结果:

  [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>, # <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>, # <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>]

用法三:

soup.find_all("a", string="Elsie")

通过 string 参数可以搜搜文档中的字符串内容.与 name 参数的可选值一样, string 参数接受 字符串 , 正则表达式 , 列表, True

用法四:

soup.find_all("a", limit=2)

limit即为查找的数量,此处查找数量为两次

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM