原文:小白学爬虫(三) - 之 Urllib库的基本使用

官方文档地址:https: docs.python.org library urllib.html 什么是Urllib Urllib是python内置的HTTP请求库包括以下模块urllib.request 请求模块urllib.error 异常处理模块urllib.parse url解析模块urllib.robotparser robots.txt解析模块 urlopen 关于urllib.re ...

2018-01-26 14:29 2 3313 推荐指数:

查看详情

小白爬虫(四) - 之 Requests的基本使用

什么是Requests Requests是用python语言基于urllib编写的,采用的是Apache2 Licensed开源协议的HTTP如果你看过上篇文章关于urllib使用,你会发现,其实urllib还是非常不方便的,而Requests它会比urllib更加方便,可以节约我们大量 ...

Fri Jan 26 22:37:00 CST 2018 0 2930
小白爬虫(六) - 之 BeautifulSoup使用

上一篇文章的正则,其实对很多人来说用起来是不方便的,加上需要记很多规则,所以用起来不是特别熟练,而这节我们提到的beautifulsoup就是一个非常强大的工具,爬虫利器。 beautifulSoup “美味的汤,绿色的浓汤” 一个灵活又方便的网页解析,处理高效,支持多种解析器。利用 ...

Mon Feb 05 00:56:00 CST 2018 0 2115
小白爬虫(五) - 之 正则的基本使用

什么是正则表达式 正则表达式是对字符串操作的一种逻辑公式,就是 事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符”,这个“规则字符” 来表达对字符的一种过滤逻辑。 正则并不是p ...

Wed Jan 31 04:13:00 CST 2018 0 1763
爬虫学习》(二)(urllib使用

urllib是Python中一个最基本的网络请求。可以模拟浏览器的行为,向指定的服务器发送一个请求,并可以保存服务器返回的数据。 1.urlopen函数: 在Python3的urllib中,所有和网络请求相关的方法,都被集到urllib.request模块下面了,以先来看下urlopen ...

Mon Jan 27 00:23:00 CST 2020 3 202
Python爬虫入门三之Urllib的基本使用

转自http://cuiqingcai.com/947.html 1.分分钟扒一个网页下来 怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但 ...

Wed Feb 25 09:39:00 CST 2015 0 2005
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM