(轉)利用Beautiful Soup去抓取p標簽下class=jstest的內容

本文轉載自查看原文 2019-08-22 14:25 383 python

1.利用Beautiful Soup去抓取p標簽下class=jstest的內容

import io
import sys
import bs4 as bs
import urllib.request

# 改變標准輸出的默認編碼為utf-8
sys.stdout = io.TextIOWrapper(sys.stdout.buffer, encoding='utf8')

# 獲取該頁面編碼並解碼成utf-8
sauce = urllib.request.urlopen(
    'http://flask.showerlee.com/scrapingtest/').read().decode('utf-8')

# 利用BS抓取頁面源代碼,並利用lxml規范格式
soup = bs.BeautifulSoup(sauce, 'lxml')

js_test = soup.find('p', class_='jstest')

print(js_test.text)

參考：http://www.showerlee.com/archives/2109

利用Beautiful Soup+Pandas+Pyqt5+Selenum進行python爬蟲

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 beautiful soup解析有空格的class beautiful soup的用法 python Beautiful Soup的使用通過PyCharm安裝Beautiful Soup etree和Beautiful Soup的使用網絡爬蟲: 從allitebooks.com抓取書籍信息並從amazon.com抓取價格(1): 基礎知識Beautiful Soup python爬蟲之Beautiful Soup的基本使用 (轉)這是我見過最牛逼，最全面的Beautiful Soup 4.2 教程！沒有之一 python中html解析-Beautiful Soup 爬蟲---Beautiful Soup 爬取圖片