Python爬蟲基礎之UrlError

本文轉載自查看原文 2017-07-16 16:45 1291 Python爬蟲/ Python

一、urllib.error

python的urllib.error模塊主要是應對urllib.request在網絡請求過程中出現的異常而定義的異常處理類。主要有URLError和HTTPError兩個類，URLError的父類是OSError，HTTPError是URLError的子類。

1.urllib.error.URLError

URLError是OSError的子類，當請求過程中沒有網絡連接，域名映射的服務器不存在都會拋出異常。

屬性reason，說明產生異常的原因，返回一個字符串錯誤信息或者另外一個異常實例對象。

 1 import urllib.request
 2 import urllib.error
 3 
 4 try:
 5     request = urllib.request.Request('http://www.baidu.com/')
 6     response = urllib.request.urlopen(request)
 7     print(response.read().decode('utf-8'))
 8 except urllib.error.HTTPError as e:
 9     print('http error:%s' % e.reason)
10 except urllib.error.URLError as e:
11     print('url error:%s' % e.reason)

產生異常：

Request參數Url傳入一個不存在的域名地址www123.baidu.com或者直接拔掉網線（禁用網絡連接），程序就會拋出URLError

request = urllib.request.Request('http://www123.baidu.com/')

捕捉並打印異常信息：url error:[Errno 11004] getaddrinfo failed

2.urllib.error.HTTPError

HTTPError是URLError的子類，urllib.request.urlopen()請求過程中產生HTTP錯誤，例如資源不存在、身份授權異常，服務器內部錯誤等。

屬性code，返回http請求的狀態碼，例如200、404、500等

屬性reason，說明產生異常的原因，返回一個字符串錯誤信息。

屬性headers，urllib.request請求觸發HTTP Error異常，返回響應的請求頭headers信息。

 1 import urllib.request
 2 import urllib.error
 3 
 4 try:
 5     request = urllib.request.Request('https://www.cnblogs.com/123.html')
 6     response = urllib.request.urlopen(request)
 7     print(response.read().decode('utf-8'))
 8 except urllib.error.HTTPError as e:
 9     print('http error: http code :{0},error msg :{1}'.format(e.code, e.reason))
10 except urllib.error.URLError as e:
11     print('url error:%s' % e.reason)

產生異常：
Request參數Url傳入一個不存在的頁面地址123.html,請求的資源不存在，程序就會拋出HTTPError異常

request = urllib.request.Request('https://www.cnblogs.com/123.html')

捕捉並打印異常信息：http error: http code :404,error msg :Not Found

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 [爬蟲]Python爬蟲基礎 Python爬蟲基礎入門小白學 Python 爬蟲（9）：爬蟲基礎零python基礎--爬蟲實踐總結 Python爬蟲基礎（三）--將爬蟲獲取到的數據寫入到csv 小白學 Python 爬蟲（34）：爬蟲框架 Scrapy 入門基礎（二）自學Python五爬蟲基礎練習之SmartQQ協議 Python 開發簡單爬蟲 - 基礎框架 PYTHON 爬蟲筆記七:Selenium庫基礎用法 Python 基礎實戰 -- 爬蟲（天氣查詢系統）