Python 爬蟲 獲取標簽下面的子標簽


thr_msgs = soup.find_all('div',class_=re.compile('msg'))

for i in thr_msgs:
    print(i)
    first = i.select('em:nth-of-type(1)')
    print(first)



>>>

<div class='\"msg\"'><em>佛山</em><em>1-3年</em><em>大專</em></div>
[<em>佛山</em>]
<div class='\"msg\"'><em>南京</em><em>3-5年</em><em>本科</em></div>
[<em>南京</em>]
<div class='\"msg\"'><em>南陽</em><em>1-3年</em><em>大專</em></div>
[<em>南陽</em>]
<div class='\"msg\"'><em>深圳</em><em>1年以內</em><em>本科</em></div>
[<em>深圳</em>]

>>>

需要下載代碼的可以到我的GitHub上下載 https://github.com/FightingBob/-Web-Crawler-training  如果覺得可以,請給我顆star鼓勵一下,謝謝!

  


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM