beautifulsoup 基本語法含class屬性查找小技巧class_

本文轉載自查看原文 2018-11-08 09:36 5232 beautifulSoup

案例一：

#coding=utf-8
import json
import requests
from bs4 import BeautifulSoup
url = 'http://www.itest.info/courses' # 定義被抓取頁面的url
soup = BeautifulSoup(requests.get(url).text, 'html.parser')# 獲取被抓取頁面的html代碼（注意這里是用 request框架獲取的頁面源碼），並使用html.parser來實例化BeautifulSoup，屬於固定套路
for course in soup.find_all('h4'):# 遍歷頁面上所有的h4標簽
　　print course.text.encode('utf-8')# 打印出h4標簽的text字符如: 測試開發--試驗班
　　print course # 打印出h4的text字符加標簽如:<h4>測試開發--試驗班</h4>

案例二:

圖例:

url = 'https://www.v2ex.com/'
soup = BeautifulSoup(requests.get(url).text, 'html.parser')
for span in soup.find_all('span', class_='item_hot_topic_title'):#查找span標簽且樣式為class_='item_hot_topic_title'，注意是class_，不是class，因為class是python的關鍵字，所以后面要加個尾巴，防止沖突
　　print span.find('a').text.encode('utf-8')#獲取里面的a標簽展示,假如span標簽里面有很多a標簽，可以 for i in span.find_all('a', href='/t/415664')繼續篩選
　　print span.find('a')['href'].encode('utf-8') #獲取href屬性，在bs4里，我們可以通過[attribute_name]的方式來獲取元素的屬性

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 BeautifulSoup根據class的屬性查找標簽的方法 beautifulsoup 根據class屬性查找標簽的方法 beautifulsoup 根據class屬性查找標簽的方法。 Class的基本語法關於Tomcat自動加載更新class的小技巧小技巧 Mongodb 動態查詢除去 _class 條件屬性class與:class JavaScript 新語法詳解：Class 的私有屬性與私有方法 class 屬性、div 屬性 ES6的 class的基本語法

beautifulsoup 基本語法 含class屬性查找小技巧class_

免責聲明！

beautifulsoup 基本語法含class屬性查找小技巧class_