python-requests模塊中常用的解碼方式
在得到返回的對象(response)后,一般不去刻意查看,是不知道編碼方式的。
通常直接猜即可,因為大多數都是使用的“utf-8”。
在requests里的快捷的解碼方式可以使用如下幾種:
response.text
類型 : str
解碼類型:根據http頭部對響應的編碼作出推測
修改:response.encoding="utf-8"
response.content.encode()
- 注意:這里encode默認使用“utf-8”
類型 :bytes
解碼方式:沒指定
response.content.encode("gbk')
- 注意:這是指定解碼方式
常見的編碼解碼方式有:
- ISO-8859-1
- utf-8
是Unicode字符的實現方式之一,它使用1-4個字符表示一個符號,根據不同的符號而變化字節長度
- ASCII碼
用來表示英文,它使用1個字節表示,其中第一位規定為0,其他7位存儲數據,一共可以表示128個字符。
- GBK/GB2312/GB18030
表示漢字。GBK/GB2312表示簡體中文,GB18030表示繁體中文。
- Unicode編碼
包含世界上所有的字符,是一個字符集。
pip安裝鏡像: https://pypi.doubanio.com/simple
