目的:復習常用的response對象的屬性
import requests
url = "http://www.baidu.com"
r = requests.get(url)
print(r.status_code) #狀態碼
print(r.content) #響應內容為二進制形式
print(r.text) #響應內容為字符串形式,但是print出來是亂碼
print(r.encoding) #返回的編碼方式為"ISO-8859-1",不認識
print(r.apparent_encoding) #返回的編碼方式為"utf-8",認識
r.encoding = 'utf-8'
print(r.text) #print出來不是亂碼,因為變更了encoding方式
總結兩種編碼
r.encoding:從header中猜測的響應方式,比如百度……header中就沒有charset字段,會直接默認了"ISO-8859-1"
r.apparent_encoding:分析內容找到的,很實在