爬蟲需要將網頁獲取的結果保存下來，現在先學習csv保存數據；

最終實現代碼：

import requests
from bs4 import BeautifulSoup
import csv

def db():
    url = "https://www.douban.com/group/"
    headers = {
        "User-Agent":"Mozilla/5.0",
        "Cookie":''
    }
    ret = requests.get(url,headers = headers)
    return ret.content

#解析網頁，並獲取帖子的url、標題
def get_data(lst,html_data):
    soup = BeautifulSoup(html_data,"html.parser")
    for i in soup.find_all("a",attrs="title"):
        lst.append([i.attrs["href"],i.attrs["title"]])

#保存url、標題到csv文件中
def save_to_csv(lst):
    with open('test.csv','w',newline='',encoding='utf-8')as f:
        f_csv = csv.writer(f)
        for data in lst:
            f_csv.writerow(data)

def main():
    Html = db()
    lst = []
    get_data(lst,Html)
    save_to_csv(lst)

main()

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 [爬蟲]Python爬蟲基礎解析爬蟲獲取的JSON數據--python爬蟲 python爬蟲之csv文件【Python學習之旅】---爬蟲數據寫入到excel python爬蟲爬取B站視頻字幕，簡單的數據處理（pandas將字幕寫入到CSV文件中）將爬蟲數據導出CSV格式 python3爬蟲初探（五）之從爬取到保存 Python3爬蟲（八）數據存儲之TXT、JSON、CSV python爬蟲系列之數據的存儲（二）：csv庫的使用 Python爬蟲時Pandas循環一行行的寫入csv以及其他格式