原文链接:https://blog.xieqiaokang.com/posts/36033.html Github:https://github.com/xieqk/Bilibili_Spide ...
心血来潮搞了一个简单的爬虫,主要是想知道某个人的b站账号,但是你知道,b站在搜索一个用户时,如果这个用户没有投过稿,是搜不到的,,,这时就只能想方法搞到对方的mid,,就是 space.bilibili.com 后面的那一串数字。偶然看到这个人关注了某个主播,,想到可能这个人会回复主播的视频,于是想着爬到所有up下的视频的评论对应的用户,这样我就可以在数据库里检索昵称得到mid,,,嘿嘿嘿 然而失 ...
2020-03-03 00:43 0 2342 推荐指数:
原文链接:https://blog.xieqiaokang.com/posts/36033.html Github:https://github.com/xieqk/Bilibili_Spide ...
一.介绍 咳咳、、、这是我最近接到的一个单子,我心想干脆就放出来吧,网上几乎都是一些零零散散的教程,我来填补这类空缺!!!(啊!我被我这开源的精神给打动了,看完了点赞呗) 我们观察bilibili网站,看看我们要爬取的人,我这里选的是老番茄这位B站一哥。 二.弹幕 通过视频 ...
爬取b站弹幕并不困难。要得到up主所有视频弹幕,我们首先进入up主视频页面,即https://space.bilibili.com/id号/video这个页面。按F12打开开发者菜单,刷新一下,在network的xhr文件中有一个getSubmitVideo文件,这个文件里就有我们需要的视频av号 ...
步骤 (本次爬虫仅以一个视频为示例:链接) 查找评论请求api 解析URL 去掉第一个和最后一个参数可得评论URL,即:https://api.bilibili.com/x/v2/reply?jsonp=jsonp& ...
步骤 (本次爬虫仅以一个视频为示例:链接) 查找评论请求api 解析URL 去掉第一个和最后一个参数可得评论URL,即:https://api.bilibili.com/x/v2/reply?jsonp=jsonp& ...
声明:全过程没有任何违法操作 弹幕部分 本部分有两个方法介绍 直接在视频页加载的文件中爬取 首先打开《ELOG》S11世界赛特别篇:欢迎回家,然后F12打开资源管理器,在网络->Fetch/XHR中寻找文件(不要问我为什么,因为一般情况下数据文件可能会在这一栏出现),然后一个一个文件 ...
...
话不多说,直接进入正题,这次采集的对象是B站吃播up主,山药村二牛,本人一直挺喜欢他的视频,所以想采集一下他的视频信息,然后分析数据,看下他视频的情况。 首先是爬虫部分,采集的逻辑是从视频页将每个视频的信息和地址采集下来,再请求地址采集视频的弹幕。 进入视频页,https ...