-
對於這樣的多級標簽
<li class="l_reply_num" style="margin-left:8px"> <span class="red" style="margin-right:3px">4790</span>回復貼,共 <span class="red">36</span>頁 </li>, <li class="l_reply_num">
-
要獲取第二個span中的內容,可以這樣寫:
url=urlopen(url)
soup=BeautifulSop(url,'html.parse')//加html.parse代表識別為html語言
total=soup.find_all('li',class_='l_reply_num')//獲取到整個li保存到total
res=total[0].contents[2]//獲取第一個li標簽下的第三個元素,即為:<span class="red">36</span>
result=res.string//獲取到第三個span中的36