python beautifulsoup獲取特定html源碼

本文轉載自查看原文 2017-05-11 23:18 3529 python/ beautifulsoup

beautifulsoup 獲取特定html源碼（無需登錄頁面）

import re
from bs4 import BeautifulSoup
import urllib2

url = 'http://www.cnblogs.com/vickey-wu/'
# connect to a URL
web = urllib2.urlopen(url)
# read html code
html = web.read()
# print html
soup = BeautifulSoup(html,'html.parser')
prety = soup.prettify()
# print prety
pointed_div = soup.findAll(name="div", attrs={"class":re.compile("forFlow")})　　　　# 篩選標簽為div且屬性class為forFlow的源碼
print pointed_div

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【Python】 html解析BeautifulSoup python 使用 BeautifulSoup 解析html [學習]用python的BeautifulSoup分析html python爬蟲之BeautifulSoup的HTML解析 python爬蟲-html解析器beautifulsoup Python學習筆記用BeautifulSoup模塊解析HTML Python 使用 beautifulsoup 4 模塊來處理 HTML Python爬蟲 | Beautifulsoup解析html頁面 Python中BeautifulSoup中對HTML標簽的提取 python BeautifulSoup4 獲取 script 節點問題