原文鏈接:https://blog.xieqiaokang.com/posts/36033.html Github:https://github.com/xieqk/Bilibili_Spide ...
心血來潮搞了一個簡單的爬蟲,主要是想知道某個人的b站賬號,但是你知道,b站在搜索一個用戶時,如果這個用戶沒有投過稿,是搜不到的,,,這時就只能想方法搞到對方的mid,,就是 space.bilibili.com 后面的那一串數字。偶然看到這個人關注了某個主播,,想到可能這個人會回復主播的視頻,於是想着爬到所有up下的視頻的評論對應的用戶,這樣我就可以在數據庫里檢索昵稱得到mid,,,嘿嘿嘿 然而失 ...
2020-03-03 00:43 0 2342 推薦指數:
原文鏈接:https://blog.xieqiaokang.com/posts/36033.html Github:https://github.com/xieqk/Bilibili_Spide ...
一.介紹 咳咳、、、這是我最近接到的一個單子,我心想干脆就放出來吧,網上幾乎都是一些零零散散的教程,我來填補這類空缺!!!(啊!我被我這開源的精神給打動了,看完了點贊唄) 我們觀察bilibili網站,看看我們要爬取的人,我這里選的是老番茄這位B站一哥。 二.彈幕 通過視頻 ...
爬取b站彈幕並不困難。要得到up主所有視頻彈幕,我們首先進入up主視頻頁面,即https://space.bilibili.com/id號/video這個頁面。按F12打開開發者菜單,刷新一下,在network的xhr文件中有一個getSubmitVideo文件,這個文件里就有我們需要的視頻av號 ...
步驟 (本次爬蟲僅以一個視頻為示例:鏈接) 查找評論請求api 解析URL 去掉第一個和最后一個參數可得評論URL,即:https://api.bilibili.com/x/v2/reply?jsonp=jsonp& ...
步驟 (本次爬蟲僅以一個視頻為示例:鏈接) 查找評論請求api 解析URL 去掉第一個和最后一個參數可得評論URL,即:https://api.bilibili.com/x/v2/reply?jsonp=jsonp& ...
聲明:全過程沒有任何違法操作 彈幕部分 本部分有兩個方法介紹 直接在視頻頁加載的文件中爬取 首先打開《ELOG》S11世界賽特別篇:歡迎回家,然后F12打開資源管理器,在網絡->Fetch/XHR中尋找文件(不要問我為什么,因為一般情況下數據文件可能會在這一欄出現),然后一個一個文件 ...
...
話不多說,直接進入正題,這次采集的對象是B站吃播up主,山葯村二牛,本人一直挺喜歡他的視頻,所以想采集一下他的視頻信息,然后分析數據,看下他視頻的情況。 首先是爬蟲部分,采集的邏輯是從視頻頁將每個視頻的信息和地址采集下來,再請求地址采集視頻的彈幕。 進入視頻頁,https ...