python-requests模塊中常用的解碼方式


python-requests模塊中常用的解碼方式

在得到返回的對象(response)后,一般不去刻意查看,是不知道編碼方式的。
通常直接猜即可,因為大多數都是使用的“utf-8”。

在requests里的快捷的解碼方式可以使用如下幾種:

response.text

類型 : str
解碼類型:根據http頭部對響應的編碼作出推測
修改:response.encoding="utf-8"

response.content.encode()

  • 注意:這里encode默認使用“utf-8”

類型 :bytes
解碼方式:沒指定

response.content.encode("gbk')

  • 注意:這是指定解碼方式

常見的編碼解碼方式有:

  • ISO-8859-1
  • utf-8

是Unicode字符的實現方式之一,它使用1-4個字符表示一個符號,根據不同的符號而變化字節長度

  • ASCII碼

用來表示英文,它使用1個字節表示,其中第一位規定為0,其他7位存儲數據,一共可以表示128個字符。

  • GBK/GB2312/GB18030

表示漢字。GBK/GB2312表示簡體中文,GB18030表示繁體中文。

  • Unicode編碼

包含世界上所有的字符,是一個字符集。

pip安裝鏡像: https://pypi.doubanio.com/simple


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM