Python爬蟲入門教程18:好看視頻的爬取


前言💨

本文的文字及圖片來源於網絡,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯系我們以作處理。

前文內容💨

Python爬蟲入門教程01:豆瓣Top電影爬取

Python爬蟲入門教程02:小說爬取

Python爬蟲入門教程03:二手房數據爬取

Python爬蟲入門教程04:招聘信息爬取

Python爬蟲入門教程05:B站視頻彈幕的爬取

Python爬蟲入門教程06:爬取數據后的詞雲圖制作

Python爬蟲入門教程07:騰訊視頻彈幕爬取

Python爬蟲入門教程08:爬取csdn文章保存成PDF

Python爬蟲入門教程09:多線程爬取表情包圖片

Python爬蟲入門教程10:彼岸壁紙爬取

Python爬蟲入門教程11:新版王者榮耀皮膚圖片的爬取

Python爬蟲入門教程12:英雄聯盟皮膚圖片的爬取

Python爬蟲入門教程13:高質量電腦桌面壁紙爬取

Python爬蟲入門教程14:有聲書音頻爬取

Python爬蟲入門教程15:音樂網站數據的爬取

Python爬蟲入門教程17:音樂歌曲的爬取

PS:如有需要 Python學習資料 以及 解答 的小伙伴可以加點擊下方鏈接自行獲取
python免費學習資料以及群交流解答點擊即可加入

基本開發環境💨

  • Python 3.6
  • Pycharm

相關模塊的使用💨

import os
import requests

安裝Python並添加到環境變量,pip安裝需要的相關模塊即可。

一、💥確定需求

在這里插入圖片描述
爬取搞笑趣味欄目的視頻內容。

二、💥網站數據分析

首先需要明確一點,好看視頻網站加載方式是懶加載的方式,需要你下滑網頁才會加載出新的內容
在這里插入圖片描述
加載出來的內容里面有音頻播放地址以及標題。

內容比較簡單,看代碼就行

import os
import requests

url = 'https://haokan.baidu.com/videoui/api/videorec?tab=gaoxiao&act=pcFeed&pd=pc&num=20&shuaxin_id=1612592171486'
headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
json_data = response.json()
videos = json_data['data']['response']['videos']
for index in videos:
    title = index['title']
    play_url = index['play_url']
    video_content = requests.get(url=play_url, headers=headers).content
    path = 'video\\'
    if not os.path.exists(path):
        os.mkdir(path)
    with open(path + title + '.mp4', mode='wb') as f:
        f.write(video_content)
        print('正在保存:', title)

在這里插入圖片描述
在這里插入圖片描述


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM