1、urlopen
打開URL 網址,url參數可以是一個字符串url或一個Request對象;
返回http.clientHTTPResponse 對象,
包含一些常用函數:read()、readinto()、getheader()、getheaders()、fileno()及msg、version、status、reason、debuglevel和close屬性。其中,
read() 函數后需要decode()函數,返回的網頁內容沒有解碼,在read()得到內容后通過encode()編碼、再通過decode()使用對應的解碼方式。
2、requests.get()
請求網站的網址,
返回get和post都返回一個Response對象。
這個對象中有服務器返回的所有信息:響應頭、狀態碼等,
返回的網頁部分會存在.content和.text 兩個對象中:
- content:返回字節碼,二進制數據。有b' 標志
- text:返回Unicode型數據,存的是BeautifulSoup根據猜測的編碼方式將content內容編碼成字符串。
打印出返回結果類型、狀態碼、編碼方式、Cookie等內容
