python:3種爬蟲的優缺點


                                                             性能對比
           爬取方法
           性    能
         使用難度
          安裝難度
       正則表達式
                 快
               困難
       簡單(內置模塊)
     BeautifulSoup
                 慢
               簡單
               簡單
             Lxml
                 快
               簡單
            相對困難
 
當網頁結構簡單並且想要避免額外依賴(不需要安裝庫),使用正則表達式更為合適。當需要爬取數據量較少時,使用較慢的BeautifulSoup也可以的。當數據量大時,需要追求效益時,Lxml時最好選擇。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2026 CODEPRJ.COM