python 爬蟲基本庫使用urllib之urlopen(一) - 碼上快樂

相關內容簡體繁體

python 爬蟲基本庫使用urllib之urlopen(一)

本文轉載自查看原文 2020-01-08 00:55 2047 python 爬蟲

urllib是python內置的請求庫。它主要包含四個模塊：

request :是最基本的HTTP請求模塊，可以用來模擬發送請求。
error:異常處理模塊，如果請求出現錯誤，可以捕獲異常，然后進行其他操作，保證程序不會意外終止。
parse:工具模塊，提供了很多URL處理方法，比如拆分、解析、合並等。
robotparser:主要用來識別網站的robots.txt文件，然后判斷哪些網站可以爬。

使用urllib的request模塊中的方法urlopen抓取python官網，這樣我們想要的東西就可以提取出來了

import urllib.request

response = urllib.request.urlopen('https://www.python.org')
print(type(response))  #類型
print(response.read().decode('utf-8'))

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Python爬蟲入門三之Urllib庫的基本使用 python urllib模塊的urlopen()的使用方法及實例 Python爬蟲之『urlopen』 Python爬蟲實戰（一）使用urllib庫爬取拉勾網數據 python爬蟲-urllib模塊 5、urllib.request.urlopen() python:urllib庫的使用：攜帶cookie Python3中Urllib庫基本使用【Python網絡爬蟲二】使用urllib2抓去網頁內容小白學 Python 爬蟲（13）：urllib 基礎使用（三）

粵ICP備18138465號 © 2018-2025 CODEPRJ.COM