原文:小白学爬虫(五) - 之 正则的基本使用

什么是正则表达式 正则表达式是对字符串操作的一种逻辑公式,就是 事先定义好的一些特定字符 及这些特定字符的组合,组成一个 规则字符 ,这个 规则字符 来表达对字符的一种过滤逻辑。 正则并不是python独有的,其他语言也都有正则python中的正则,封装了re模块 python正则的详细讲解 常用的匹配模式 re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配的话,match ...

2018-01-30 20:13 0 1763 推荐指数:

查看详情

小白爬虫(四) - 之 Requests库的基本使用

什么是Requests Requests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP库如果你看过上篇文章关于urllib库的使用,你会发现,其实urllib还是非常不方便的,而Requests它会比urllib更加方便,可以节约我们大量 ...

Fri Jan 26 22:37:00 CST 2018 0 2930
小白爬虫(六) - 之 BeautifulSoup库的使用

上一篇文章的正则,其实对很多人来说用起来是不方便的,加上需要记很多规则,所以用起来不是特别熟练,而这节我们提到的beautifulsoup就是一个非常强大的工具,爬虫利器。 beautifulSoup “美味的汤,绿色的浓汤” 一个灵活又方便的网页解析库,处理高效,支持多种解析器。利用 ...

Mon Feb 05 00:56:00 CST 2018 0 2115
小白爬虫(二) - 之爬虫的原理

在上文中我们说了:爬虫就是请求网站并提取数据的自动化程序。其中请求,提取,自动化是爬虫的关键!下面我们分析爬虫的基本流程 爬虫的基本流程 发起请求通过HTTP库向目标站点发起请求,也就是发送一个Request,请求可以包含额外的header等信息,等待服务器响应 获取响应内容如果服务器 ...

Fri Jan 26 22:28:00 CST 2018 0 4059
小白 Python 爬虫(12):urllib 基础使用(二)

人生苦短,我用 Python 前文传送门: 小白 Python 爬虫(1):开篇 小白 Python 爬虫(2):前置准备(一)基本类库的安装 小白 Python 爬虫(3):前置准备(二)Linux基础入门 小白 Python 爬虫(4):前置准备 ...

Fri Dec 06 16:45:00 CST 2019 0 318
小白 Python 爬虫(11):urllib 基础使用(一)

人生苦短,我用 Python 前文传送门: 小白 Python 爬虫(1):开篇 小白 Python 爬虫(2):前置准备(一)基本类库的安装 小白 Python 爬虫(3):前置准备(二)Linux基础入门 小白 Python 爬虫(4):前置准备 ...

Thu Dec 05 16:44:00 CST 2019 1 301
小白 Python 爬虫(13):urllib 基础使用(三)

人生苦短,我用 Python 前文传送门: 小白 Python 爬虫(1):开篇 小白 Python 爬虫(2):前置准备(一)基本类库的安装 小白 Python 爬虫(3):前置准备(二)Linux基础入门 小白 Python 爬虫(4):前置准备 ...

Mon Dec 09 16:45:00 CST 2019 0 292
小白 Python 爬虫(17):Requests 基础使用

人生苦短,我用 Python 前文传送门: 小白 Python 爬虫(1):开篇 小白 Python 爬虫(2):前置准备(一)基本类库的安装 小白 Python 爬虫(3):前置准备(二)Linux基础入门 小白 Python 爬虫(4):前置准备 ...

Fri Dec 13 16:45:00 CST 2019 0 361
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM