一、前言 好不容易女神喊我去看电影,但是她又不知道看啥,那么我当然得准备准备~ 二、前期准备 1、使用的软件 python 3.8 开源 免费的 (统一 3.8) Pycharm YYDS python最好用的编辑器 不接受 ...
模块库使用说明 . requests库 requests 是用Python语言编写,基于 urllib,采用 Apache Licensed 开源协议的 HTTP 库。它比 urllib 更加方便,可以节约我们大量的工作,完全满足 HTTP 测试需求。 . urllib库 urllib的request模块可以非常方便地抓取URL内容,也就是发送一个GET请求到指定的页面,然后返回HTTP的响应. ...
2018-05-09 14:28 0 1488 推荐指数:
一、前言 好不容易女神喊我去看电影,但是她又不知道看啥,那么我当然得准备准备~ 二、前期准备 1、使用的软件 python 3.8 开源 免费的 (统一 3.8) Pycharm YYDS python最好用的编辑器 不接受 ...
主要用到lxml的etree解析网页代码,xpath获取HTML标签。 代码如下: 获取豆瓣网正在上映电影最热评论 执行效果: 文件详情: ...
之前我们从猫眼获取过电影信息,而且利用分析ajax技术,获取过今日头条的街拍图片。 今天我们在豆瓣上获取一些热门电影的信息。 页面分析 首先,我们先来看一下豆瓣里面选电影的页面,我们默认选择热门电影,啥都不点了。 【插入图片,豆瓣热门电影页面】 在选电影这个框中其实有很多标签 ...
...
...
海王是前段时间大热的影片,个人对这种动漫题材的电影并不是很感兴趣.然鹅,最近这部电影实在太热了,正好最近看自然语言处理的时候,无意间发现了word cloud这个生成词云的库,还蛮好玩的,那就抓抓这部电影的影评来试试吧. 爬虫抓取豆瓣海王影评 首先我们登陆豆瓣,进入海王的影评页面 ...
什么是词云呢? 词云就是一些关键词组成的一个图片。大家在网上经常看到,下面看一些例子: 那用python生成一个词云的话怎么办呢,首先要有一些词,随便找个吧,用see you again的歌词好了,放到again.txt里面,放着待会用。 然后呢,咱们用 wrodcloud这个模块 ...
bilibili弹幕词云 ...