原文:爬取哔哩哔哩评论区(包含对评论的回复)并保存在xlsx中

第一次写爬虫,作业要求写报告,那就修改一下顺便发到这里啦。最后成型的代码大量参考了这里 代码地址在这里 要干什么 通过python爬虫抓取哔哩哔哩弹幕视频网任一视频下的评论内容并保存为表格 .xlsx 主要的问题 获取请求URL 一开始没有查看api文档 直接尝试获取URL时已知出现问题,后来才知道要删除中间的jQuery段 存储 因为爬取的是评论区,常常有大段的文字,常用 n 换行,常用的cs ...

2022-04-10 17:01 1 1119 推荐指数:

查看详情

哩视频源码分享

背景:   无意间发现B站有个老师的课程特别好(python教学的视频),单位的网络限制了视频网站访问,所以尝试着去把视频下载保存起来,经过一段时间的研究终于完成代码的开发,大家有需要的可以搞下来,后续我会进行一个延伸优化,争取做到通过前端页面的视频名称输入作为条件进行下载。 第一版 ...

Wed Feb 24 17:20:00 CST 2021 0 291
哩番剧排行榜

一.主题式网络主题式网络爬虫设计方案 1.爬虫名称:哩番剧排行榜 2.内容:番剧名称、播放量、评论数、喜欢人数、综合得分。网站:"https://www.bilibili.com/ranking/bangumi/13/0/3" 3.网络爬虫设计方案概述: 思路:通过分 ...

Fri Apr 17 10:01:00 CST 2020 0 768
python网易评论

学习python不久,最近的网页都是直接源代码中直接就有的,看到网易新闻的评论时,发现评论时以json格式加载的..... 的网页是习大大2015访英的评论页http://comment.news.163.com/news_guonei8_bbs/SPEC0001B60046CG.html ...

Sat Oct 24 03:25:00 CST 2015 7 4857
python京东评论

一.分析 1.找到京东商品评论所在位置(记得点击商品评论,否则找不到productPageComments.action) 2.解析文件 打开后发现是json数据,但不是那么规范,所以需要去点前面的字符串和括号,还有最后一行的分号和括号 3.放到json解析器可以看到数据 ...

Thu Mar 17 01:14:00 CST 2022 0 2380
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM