python中使用requests库获取网页内容


requests是python中的一个第三方库,可以获取网页内容

安装指令:pip install requests 如果是python3.0版本以上则是:pip3 install requests 命令行下输入 import requests 回车,不报错则安装成功

import requests 导入模块,注意py文件命名不能和模块名重复

网页有很多种打开方式,最常见的是get方式(直接输入网址访问)和post方式(从另一个页面单击链接进入)

get方式获取网页内容:requests.get('url').content.decode()

先得到一个Response响应对象,用content方法转变为二进制字节数据类型对象bytes(中文在bytes中无法显示),用decode方法转变为字符串型的源代码

注意 .content 是用于显示有图片,音频,视频等内容的网页,需要decode解码

.text 是用于显示只是字符的网页

上面方法的参数可以省略,默认使用utf-8编码格式,如果网页不是这种编码格式,需要在括号里写明目标编码格式的名字


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM