Requests庫的七個主要方法:
requests.request()
構造一個請求,支撐一下各方法的基礎方法
requests.get()
獲取HTML網頁的主要方法,對應HTTP的GET
requests.head()
獲取HTML網頁頭的信息方法,對應HTTP的HEAD
requests.post()
向HTML網頁提交POST請求方法,對應HTTP的POST
requests.put()
向HTML網頁提交PUT請求的方法,對應HTTP的RUT
requests.patch()
向HTML網頁提交局部修改請求,對應於HTTP的PATCH
requests.delete()
向HTML頁面提交刪除請求,對應HTTP的DELETE
get()方法
r = requests.get(url,params = None,**kwargs)
url:網址
params:url中的額外參數,字典或字節流格式,可選
**kwargs:12個控制訪問參數
>>>import requests #加載requests模塊
>>>r = requests.get('https://www.baidu.com') #爬取url的網址信息
>>>print(r.status_code) #查看狀態
200 #200為正常,404為錯誤
>>>type(r) #查看它的類
<class 'requests.models.Response'> #response類
>>>r.headers #獲得頭部信息
response對象的屬性
r.status_code HTTP請求的返回狀態
r.text HTTP響應內容的字符串形式,即:url對應的頁面內容
r.encoding 從HTTP header中猜測的響應內容編碼方式
r.apparent_encoding 從內容中分析出的響應內容編碼方式(備選編碼方式)
r.content HTTP響應內容的二進制形式
示例:
>>>import requests
>>>r = requests.get('https://www.baidu.com')
>>>r.status_code
200
>>>r.text
>>>r.encoding
'ISO-8859-1'
>>>r.apparent_encoding
'utf-8'
>>>r.encoding = 'utf-8'
>>>r.text