(轉)利用Beautiful Soup去抓取p標簽下class=jstest的內容


1.利用Beautiful Soup去抓取p標簽下class=jstest的內容

import io
import sys
import bs4 as bs
import urllib.request

# 改變標准輸出的默認編碼為utf-8
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf8')

# 獲取該頁面編碼並解碼成utf-8
sauce = urllib.request.urlopen(
    'http://flask.showerlee.com/scrapingtest/').read().decode('utf-8')

# 利用BS抓取頁面源代碼,並利用lxml規范格式
soup = bs.BeautifulSoup(sauce, 'lxml')

js_test = soup.find('p', class_='jstest')

print(js_test.text)

參考:http://www.showerlee.com/archives/2109

利用Beautiful Soup+Pandas+Pyqt5+Selenum進行python爬蟲


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM