python爬取斗鱼B总直播弹幕


在某群中看到关于弹幕爬取的需求,又因为斗鱼比较OP,就以这个作为切入点。

如果你想了解如何获取弹幕,我的这个例子就可以让你豁然开朗,对于哪些没有开发弹幕的直播或视频平台,就需要用抓包工具获取请求,然后分析请求数据包内容,现在说说我的获取步骤吧。

我通过了解到斗鱼弹幕的api,根据标准协议,构建请求包,向弹幕服务器发送请求,接受请求后用正则表达式分离出现在想要的内容。

效果图如下:

 

在results文件夹中打开爬取到的弹幕文件

 

还有生成的词云

 

我将代码都放到了github上,下面是地址

https://github.com/bjptw/workspace


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM