【python爬蟲】 之 爬取百度首頁


剛開始學習爬蟲,照着教程手打了一遍,還是蠻有成就感的。使用版本:python2.7

注意:python2的默認編碼是ASCII編碼而python3默認編碼是utf-8

import urllib2

url = "http://www.baidu.com"
response = urllib2.urlopen(url)
print response.read().decode('utf-8')

 

不過建議大家不要像上面那樣寫,這樣寫最好:

#定義需要用到的庫urllib2
 import urllib2

#定義URL,構建請求
url = "http://www.baidu.com"
request = urllib2.Request(url)

#返回
 response = urllib2.urlopen(request)

#打印返回的數據
 print response.read().decode('utf-8')

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM