基于python对B站收藏夹按照视频发布时间进行排序 前言 在最一开始,我的B站收藏一直是存放在默认收藏夹中,但是随着视频收藏的越来越多,没有分类的视频放在一起,想在众多视频中找到想要的视频非常困难,因此就对收藏夹里面的视频进行了分类。但是分类之后紧接着又出现了一个新的问题:原来存放在默认 ...
我们除了爬取文本信息,有的时候还需要爬媒体信息,比如视频图片音乐等。就拿B站来说,我的收藏夹内的视频可能随时会失效,所以把它们下载到本地是非常保险的一件事。 对于这种大量列表型的数据,可以猜测B站收藏夹的请求中,详细的收藏详细可能会是异步加载的,因为这部分数据可能比较庞大。 我们来分析一下网络请求。 可以看到对收藏夹的请求是指定URL加收藏夹的id号,我们爬取的前提是这个收藏夹是公共收藏夹,不然是 ...
2019-09-28 10:38 0 1147 推荐指数:
基于python对B站收藏夹按照视频发布时间进行排序 前言 在最一开始,我的B站收藏一直是存放在默认收藏夹中,但是随着视频收藏的越来越多,没有分类的视频放在一起,想在众多视频中找到想要的视频非常困难,因此就对收藏夹里面的视频进行了分类。但是分类之后紧接着又出现了一个新的问题:原来存放在默认 ...
一个一个下载:https://www.zhihu.com/question/41367609 WSDAB的回答批量下载:https://www.zhihu.com/question/49793759(那个file1/2的脚本太酷了~) 繁琐操作(没尝试):https ...
之前两篇已经说完了如何爬取网页以及如何解析其中的数据,那么今天我们就可以开始第一次实战了。 这篇实战包含两个内容。 * 利用爬虫调用Api来解析照片的拍摄位置 * 利用爬虫爬取Bilibili视频中的弹幕 关于爬虫调用Api这一说法,其实就是通过get或者post请求携带着参数,将内容发给 ...
前言 之前好像有人问怎么用python下载B站的视频,于是今天稍微研究了一下,发现还是挺简单的,于是过来分享一波。 让我们愉快地开始吧~ 开发工具 Python版本:3.6.4 相关模块: requests模块; contextlib模块; 以及一些Python自带的模块 ...
批量下载B站视频 跳转:https://github.com/soimort/you-get 一些 you-get 的参数 -l 网址 # 批量下载这个网址下的所有视频 -c 浏览器的cookies文件 # 通过浏览器 ...
首先分析下b站的视频地址构成,如https://www.bilibili.com/video/BV1BW411R7QK?p=1,是由视频编号加节数组成,如p=1代表视频列表的第一集, p=2等与视频第二集。 所以类似爬虫,我们可以循环使用脚本命令和第三下载工具,如wget或you-get ...
首先,随便打开一个视频,比如这个《你是性感的小偷》: 然后option+command+i调出控制台(以chrome为例): 会发现相应过来的内容里,有两种名字的xhr文件,其中30080代表视频,30280代表音频,查看右边的Request URL,发现这个URL是固定的,但是直接 ...
步骤 (本次爬虫仅以一个视频为示例:链接) 查找评论请求api 解析URL 去掉第一个和最后一个参数可得评论URL,即:https://api.bilibili.com/x/v2/reply?jsonp=jsonp& ...