安裝bs4后,運行測試報錯
from bs4 import BeautifulSoup from selenium import webdriver # 登錄界面的url url = 'https://passport.bilibili.com/login' # 實例化一個chrome瀏覽器 browser = webdriver.Chrome(executable_path="../tool/chromedriver_81.0.4044.69.exe") # 窗口最大化 browser.maximize_window() browser.get(url) # 將網頁源碼轉化為能被解析的lxml格式 soup = BeautifulSoup(browser.page_source, 'lxml') print(soup.title.string)
經過測試發現是lxml的問題,使用 pip install lxml 安裝,安裝完后,在運行還是一樣出錯, 經百度、知乎的說法是新的庫不支持,新版本語法支持改變了
使用 pip install lxml時,自動安裝的是最新 4.2.5版本
解決方法一:
卸載新的換老的就可以了
pip uninstall lxml
pip install lxml==3.7.0
方法二:
在報錯代碼中把函數參數中所有的"lxml"改成"html.parser"
soup = BeautifulSoup(browser.page_source, 'lxml')
改成 soup = BeautifulSoup(browser.page_source, 'html.parser')