哈嘍大家好 我是阿喵,今天也是學習爬蟲的一天
利用python寫一個簡單的筆趣閣爬蟲,根據輸入的小說網址爬取整個小說並保存到txt文件。爬蟲用到了BeautifulSoup庫的select方法
結果如圖所示:

本文只用於學習爬蟲
一、網頁解析
這里以斗羅大陸小說為例 網址:
http://www.biquge001.com/Book/2/2486/

可以發現每章的網頁地址和章節名都放在了 <"div id=list dl dd a>中的a標簽中,所以利用BeautfulSoup中的select方法可以得到網址和章節名
然后遍歷列表
然后每章小說的內容都存放在<div id=“content” 里 同理得
最后同理在首頁獲取小說的名稱
<"div id = info h1>

二、代碼填寫
1.獲取Html及寫入方法
2.其余代碼
代碼如下(示例):
總結
簡單利用了BeautfulSoup的select方法對筆趣閣的網頁進行了爬取
在這里還是要推薦下我自己建的Python學習群:609616831,群里都是學Python的,如果你想學或者正在學習Python ,歡迎你加入,大家都是軟件開發黨,不定期分享干貨(只有Python軟件開發相關的),包括我自己整理的一份2020最新的Python進階資料和零基礎教學,歡迎進階中和對Python感興趣的小伙伴加入!