【python爬虫】 之 爬取百度首页


刚开始学习爬虫,照着教程手打了一遍,还是蛮有成就感的。使用版本:python2.7

注意:python2的默认编码是ASCII编码而python3默认编码是utf-8

import urllib2

url = "http://www.baidu.com"
response = urllib2.urlopen(url)
print response.read().decode('utf-8')

 

不过建议大家不要像上面那样写,这样写最好:

#定义需要用到的库urllib2
 import urllib2

#定义URL,构建请求
url = "http://www.baidu.com"
request = urllib2.Request(url)

#返回
 response = urllib2.urlopen(request)

#打印返回的数据
 print response.read().decode('utf-8')

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM