——更新日志—— 23年5月15日 增加JSON库来优化代码,提高可读性 23年1月31日 优化代码,增加错误提示,把正则表达式单独列出 特别说明:获取LiveStreamId的正则表达式有变动 22年12月21日 优化了部分代码,直接输入直播链接即可获取弹幕 22年7月14日 ...
在某群中看到关于弹幕爬取的需求,又因为斗鱼比较OP,就以这个作为切入点。 如果你想了解如何获取弹幕,我的这个例子就可以让你豁然开朗,对于哪些没有开发弹幕的直播或视频平台,就需要用抓包工具获取请求,然后分析请求数据包内容,现在说说我的获取步骤吧。 我通过了解到斗鱼弹幕的api,根据标准协议,构建请求包,向弹幕服务器发送请求,接受请求后用正则表达式分离出现在想要的内容。 效果图如下: 在results ...
2018-07-10 18:00 0 1368 推荐指数:
——更新日志—— 23年5月15日 增加JSON库来优化代码,提高可读性 23年1月31日 优化代码,增加错误提示,把正则表达式单独列出 特别说明:获取LiveStreamId的正则表达式有变动 22年12月21日 优化了部分代码,直接输入直播链接即可获取弹幕 22年7月14日 ...
B站弹幕简单爬虫 功能:获取视频弹幕并保存到txt文档 使用方法:找到b站视频所在的aid,传入到main函数下的av='一串数字,即aid'即可 找aid方法:视频下有个转发按钮,鼠标放上去可以看到有个嵌入代码iframe,那里就有aid。或者检查、network、刷新一下,在Name栏可以找到 ...
获取B站视频弹幕,相对来说很简单,需要用到的知识点有requests、re两个库。requests用来获得网页信息,re正则匹配获取你需要的信息,当然还有其他的方法,例如Xpath。进入你所观看的视频的页面,F12进入开发者工具,选择网络。查找我们需要的信息,发现域名那列有 ...
声明不用说了,直接进入主题 还是接上次的爬虫爬取B站视频弹幕和评论 思路 以我的主页为例,如下 然后找到存有我相关视频数据的文件,如下 然后我们随便点开一个视频,进入api端口查看相关信息 我们发现视频的cid号和oid号是一样的,所以我们只需要获取到视频相应的cid,然后将弹幕文件中 ...
写在前面 今天和朋友唠嗑,说着说着说到了爬取B站弹幕和三连的事情。于是就想着用python来试试爬取B站的弹幕和三连了 代码 不废话了,先上代码: 这里关于找api的操作,可以自行用火狐或者谷歌的开发者模式去寻找。 在这里由于B站的弹幕是用xml存的,且最大弹幕量是1000,即只爬 ...
1 分析数据来源 在不知道弹幕信息在哪里的时候,只能去all里面查看每一个相应的信息,看信息是否含有弹幕信息 在知道弹幕信息文件的时候,我们可以直接用全局文件搜索,定位到弹幕数据文件.操作如下图 2 查看文件的请求信息 3 查看请求头信息 ...
一 . Java爬取B站弹幕 弹幕的存储位置 如何通过B站视频AV号找到弹幕对应的xml文件号 首先爬取视频网页,将对应视频网页源码获得 就可以找到该视频的av号aid=8678034 还有弹幕序号,cid=14295428 弹幕存放位置为 http ...
如何通过B站视频AV号找到弹幕对应的xml文件号 首先爬取视频网页,将对应视频网页源码获得 就可以找到该视频的av号aid=8678034 还有弹幕序号,cid=14295428 弹幕存放位置为 http://comment.bilibili.com ...