BeautifulSoup检索多级标签


  • 对于这样的多级标签

    <li class="l_reply_num" style="margin-left:8px">
    	<span class="red" style="margin-right:3px">4790</span>回复贴,共
    	<span class="red">36</span>页
    </li>, <li class="l_reply_num">
    
  • 要获取第二个span中的内容,可以这样写:

url=urlopen(url)
soup=BeautifulSop(url,'html.parse')//加html.parse代表识别为html语言
total=soup.find_all('li',class_='l_reply_num')//获取到整个li保存到total
res=total[0].contents[2]//获取第一个li标签下的第三个元素,即为:<span class="red">36</span>
result=res.string//获取到第三个span中的36


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM