性能對比
|
爬取方法
|
性 能
|
使用難度
|
安裝難度
|
|
正則表達式
|
快
|
困難
|
簡單(內置模塊)
|
|
BeautifulSoup
|
慢
|
簡單
|
簡單
|
|
Lxml
|
快
|
簡單
|
相對困難
|
當網頁結構簡單並且想要避免額外依賴(不需要安裝庫),使用正則表達式更為合適。當需要爬取數據量較少時,使用較慢的BeautifulSoup也可以的。當數據量大時,需要追求效益時,Lxml時最好選擇。
