python網絡爬蟲(四)python第三方庫BeautifulSoup4的安裝及測試


一、安裝

1.以管理員身份啟動cmd

 

2.輸入口令:python -m pip install beautifulsoup4 敲回車  我在這給大家提個醒,配置環境真的很費時間,中間會出現各種問題,一定不要心急,

心急吃不了熱豆腐呀~但是python庫安裝我認為遇到的問題都是一樣的,就是超時,我是一直不斷地讓它安裝,反反復復7/8次,不着急,超時就讓它超時,

能安裝一點是一點,到最后肯定能安裝好~ 給大家上圖我不斷超時、最后終於成功的截圖!

 

 

 

 

 

 3.在安裝成功后,大家可以測試一下是否安裝成功。

演示HTML頁面地址:http://python123.io/ws/demo.html

可以單擊右鍵鼠標選擇查看網頁源代碼,看不懂不要緊哦,就理解程成是許許多多的標簽,構成了頁面,一個排版規則

 

 

 原理就是:我們先用requests庫get()方法爬取網頁所有內容,然后定義demo為整個文本內容,然后讓beautifulsoup(類)來熬制這個湯熬成

它能理解的HTML5。注意哦,我們雖然導入的是beautifulsoup4庫,但是我們在寫的時候寫成了縮寫bs4,並且只用一個BeautifulSoup類,

注意B、S是大寫

 

1 import requests
2 r = requests.get("https://python123.io/ws/demo.html")
3 demo = r.text
4 from bs4 import BeautifulSoup
5 soup = BeautifulSoup(demo,"html.parser")  #熬制html類型的解釋的湯
6 print(soup.prettify)

 

 

 

 

 

 這就是今天的第三方庫的安裝和檢測的學習,是不是歷程艱辛但是也是很有趣呢~貴在堅持啦😀😀😀😀😀😀

--------------------------下一期將帶來BeautifulSoup4的簡單學習!!加油,貴在堅持!------------------------------------------

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM