原文:python-2:爬取某个网页(虎扑)帖子的标题做词云图

关键词:requests,BeautifulSoup,jieba,wordcloud 整体思路:通过requests请求获得html,然后BeautifulSoup解析html获得一些关键数据,之后通过jieba分词对数据进行切分,去停,最后通过wordcloud画词云图 请求虎扑Acg区 Acg区首页的url为:https: bbs.hupu.com acg Acg区第二页的url为:https ...

2019-08-08 15:28 0 378 推荐指数:

查看详情

Python球员生涯数据

一、网络爬虫设计方案 1、爬虫名称:球员生涯数据 2、内容:球员生涯数据 3、概述:首先分析页面结构,使用requests模块获取网页源代码,再使用BeautifulSoup解析得到所需要的数据 二、主题页面的结构特征分析 1.主题页面的结构与特征分析 球员生涯 ...

Tue Apr 21 04:50:00 CST 2020 0 623
[python爬虫] Selenium定向篮球海量精美图片

前言: 作为一名从小就看篮球的球迷,会经常逛篮球及湿乎乎等论坛,在论坛里面会存在很多精美图片,包括NBA球队、CBA明星、花边新闻、球鞋美女等等,如果一张张右键另存为的话真是手都点疼了。作为程序员还是写个程序来进行吧! 所以我通过Python ...

Fri Dec 18 11:29:00 CST 2015 0 1727
python 豆瓣电影短评并wordcloud生成云图

最近学到数据可视化到了云图,正好学到爬虫,各种网站 【实验名称】 豆瓣电影《千与千寻》的评论并生成云 1. 利用爬虫获得电影评论的文本数据 2. 处理文本数据生成云图 第一步,准备数据   需要登录豆瓣网站才能够获得短评文本数据https://movie.douban.com ...

Sat May 25 03:55:00 CST 2019 0 741
python豆瓣影评,根据关键生成云图

背景: python 版本:3.7.4 使用IDEA:pycharm 操作系统:Windows64 第一步:获取登录状态 豆瓣评论是需要用户登录的,所以需要先拿到登陆相关 cookie。进入浏览器(IE浏览器把所有的 cookie 集合到一起了,比较方便取值,其他浏览器需要自己整合 ...

Mon Apr 20 19:27:00 CST 2020 0 1206
python-爬虫

  Python作为一个高级编程语言,不知从何时起就在圈子里流行起来了。个人也是图个鲜,跟上时代步伐学习了一下。“鲁迅”说过:不能学以致用,就是耍流氓。我用python论坛作了一个爬虫。脚本写的糙了点,权作初学者交流使用,同时也方便以后查阅。本来是准备写一个的分析帖子,可后来动力不足 ...

Tue Jan 30 17:21:00 CST 2018 0 926
Python爬虫贴吧的帖子内容

最近在看一个大神的博客,从他那里学会了很多关于python爬虫的知识,其实python如果想用在实际应用中,你需要了解许多,比如正则表达式、引入库、过滤字段等等,下面不多说,我下面的程序是Ubuntu吧的一个帖子,要是问我为什么选择Ubuntu吧,没为什么,win、mac、linux我都用 ...

Sun May 31 01:29:00 CST 2015 1 4046
Python 并进行分类数据分析-[云图制作+数据导入]

日期:2020.01.28 博客期:136 星期二   【本博客的代码如若要使用,请在下方评论区留言,之后再用(就是跟我说一声)】   所有相关跳转:   a.【简单准备】   b.【云图制作+数据导入】(本期博客)   c.【拓扑数据】   d.【数据修复】   e. ...

Wed Jan 29 05:56:00 CST 2020 3 191
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM