python爬蟲之爬取小說（一）

本文轉載自查看原文 2020-09-23 10:05 658 爬蟲/ python

爬取“盜墓筆記”小說

import requests
from bs4 import BeautifulSoup
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.102 Safari/537.36'
}


def open_url(url):
    r = requests.get(url, headers=headers)
    r.encoding = 'gbk'
    html = r.text
    return html


def get_title(html):
    soup = BeautifulSoup(html, 'lxml')
    title_tag = soup.find('div', class_='h1title')
    return title_tag.text + '\n'


def get_text(html):
    soup2 = BeautifulSoup(html, 'lxml')
    text_tag = soup2.find('div', id='htmlContent')
    return text_tag.text


def save(title, text):
    with open('盜墓筆記.txt', 'a+', encoding='utf-8') as file:
        file.write(title)
        file.write(text)
    print('下載完成！')


def main():
    while True:
        num = int(input('請輸入你想要下載第幾章：')) + 78209
        url = 'http://www.taiuu.com/0/67/' + str(num) + '.html'
        html = open_url(url)
        title = get_title(html)
        text = get_text(html)
        save(title, text)
        repeat = input('請問還要繼續下載嗎？（y/n）')
        if repeat == 'y':
            continue
        else:
            break
            print('已退出!')


if __name__ == '__main__':
    main()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 python爬蟲之小說爬取初次嘗試python爬蟲，爬取小說網站的小說。 Python爬蟲-爬小說 python從爬蟲基礎到爬取網絡小說實例 Python網絡爬蟲爬取網絡小說信息 python3爬蟲-使用requests爬取起點小說 Python爬蟲爬取目標小說並保存到本地 Python實戰項目網絡爬蟲之爬取小說吧小說正文 Python爬蟲練習（一）爬取筆趣閣小說（搜索+爬取） Python基礎之爬取小說