原文:爬取嗶哩嗶哩評論區(包含對評論的回復)並保存在xlsx中

第一次寫爬蟲,作業要求寫報告,那就修改一下順便發到這里啦。最后成型的代碼大量參考了這里 代碼地址在這里 要干什么 通過python爬蟲抓取嗶哩嗶哩彈幕視頻網任一視頻下的評論內容並保存為表格 .xlsx 主要的問題 獲取請求URL 一開始沒有查看api文檔 直接嘗試獲取URL時已知出現問題,后來才知道要刪除中間的jQuery段 存儲 因為爬取的是評論區,常常有大段的文字,常用 n 換行,常用的cs ...

2022-04-10 17:01 1 1119 推薦指數:

查看詳情

哩視頻源碼分享

背景:   無意間發現B站有個老師的課程特別好(python教學的視頻),單位的網絡限制了視頻網站訪問,所以嘗試着去把視頻下載保存起來,經過一段時間的研究終於完成代碼的開發,大家有需要的可以搞下來,后續我會進行一個延伸優化,爭取做到通過前端頁面的視頻名稱輸入作為條件進行下載。 第一版 ...

Wed Feb 24 17:20:00 CST 2021 0 291
哩番劇排行榜

一.主題式網絡主題式網絡爬蟲設計方案 1.爬蟲名稱:哩番劇排行榜 2.內容:番劇名稱、播放量、評論數、喜歡人數、綜合得分。網站:"https://www.bilibili.com/ranking/bangumi/13/0/3" 3.網絡爬蟲設計方案概述: 思路:通過分 ...

Fri Apr 17 10:01:00 CST 2020 0 768
python網易評論

學習python不久,最近的網頁都是直接源代碼中直接就有的,看到網易新聞的評論時,發現評論時以json格式加載的..... 的網頁是習大大2015訪英的評論頁http://comment.news.163.com/news_guonei8_bbs/SPEC0001B60046CG.html ...

Sat Oct 24 03:25:00 CST 2015 7 4857
python京東評論

一.分析 1.找到京東商品評論所在位置(記得點擊商品評論,否則找不到productPageComments.action) 2.解析文件 打開后發現是json數據,但不是那么規范,所以需要去點前面的字符串和括號,還有最后一行的分號和括號 3.放到json解析器可以看到數據 ...

Thu Mar 17 01:14:00 CST 2022 0 2380
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM