-
对于这样的多级标签
<li class="l_reply_num" style="margin-left:8px"> <span class="red" style="margin-right:3px">4790</span>回复贴,共 <span class="red">36</span>页 </li>, <li class="l_reply_num">
-
要获取第二个span中的内容,可以这样写:
url=urlopen(url)
soup=BeautifulSop(url,'html.parse')//加html.parse代表识别为html语言
total=soup.find_all('li',class_='l_reply_num')//获取到整个li保存到total
res=total[0].contents[2]//获取第一个li标签下的第三个元素,即为:<span class="red">36</span>
result=res.string//获取到第三个span中的36