爬取豆瓣電影Top250

本文轉載自查看原文 2019-10-07 14:18 433 爬豆瓣

目標

學習爬蟲，爬豆瓣榜單，獲取爬取靜態頁面信息的能力

豆瓣電影 Top 250 https://movie.douban.com/top250

代碼

import requests
from bs4 import BeautifulSoup
def getHTMLText(url):
    try:
        r = requests.get(url,timeout=30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return '產生異常'
    
if __name__ == '__main__':
    i = 0
    urls = ['https://movie.douban.com/top250?start='+str(n)+'&filter=' for n in range(0,250,25)]
    for url in urls:
        r = getHTMLText(url)
        soup = BeautifulSoup(r,'html.parser')
        titles = soup.select('div.hd a')
        rates = soup.select('span.rating_num')
        pics = soup.select('img[width="100"]')
        for title,rate,pic in zip(titles,rates,pics):
            data={'title':list(title.stripped_strings),
                  'rate':rate.get_text(),
                  'pic':pic.get('src')}
            i+=1
            fileName=str(i)+'_'+data['title'][0]+' '+data['rate']+'分.jpg'
            pic1 = requests.get(data['pic'])
            with open('G:\\test\\'+fileName,'wb') as photo:
                photo.write(pic1.content)
            print(data)

爬取結果

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 爬取豆瓣電影TOP250榜爬蟲實戰：爬取豆瓣電影top250 python3爬取豆瓣top250電影爬取豆瓣電影排行top250 python爬取豆瓣電影top250 python爬取豆瓣top250電影源碼 Python爬蟲——爬取豆瓣電影Top250 python3 爬蟲---爬取豆瓣電影TOP250 爬取豆瓣讀書top250 豆瓣TOP250爬取及分析

爬取 豆瓣電影Top250

目標

代碼

爬取結果

免責聲明！

爬取豆瓣電影Top250