在 Python3 中,bytes 和 str 的互相轉換方式是


str.encode('utf-8')
bytes.decode('utf-8')

 

 

字符串前加 b

python3.x里默認的str是(py2.x里的)unicode, bytes是(py2.x)的str, b 前綴代表的就是bytes 

python2.x里, b前綴沒什么具體意義, 只是為了兼容python3.x的這種寫法

    小知識:

          python2默認字符編碼是ASCII, 當你用python2的解釋器去運行你寫好的py2代碼(硬盤中), 解釋器會用ASCII的編碼規則去讀取, 由於ACSII編碼不支持中文, 所以我們一般在py2代碼首行: #encoding: utf-8來指定字符編碼規則為utf-8

           python3默認的字符編碼是Unicode, 當你用python3的解釋器去執行你寫好的py3代碼(硬盤中), 解釋器會用UTF-8編碼規則來讀取

例: response = b'<h1>Hello World!</h1>'     # b' ' 表示這是一個 bytes 對象

作用: b" "前綴表示:后面字符串是bytes 類型。

用處:網絡編程中,服務器和瀏覽器只認bytes 類型數據。

如:send 函數的參數和 recv 函數的返回值都是 bytes 類型

附:

在 Python3 中,bytes 和 str 的互相轉換方式是
str.encode('utf-8')
bytes.decode('utf-8')

字符串前加 u

u/U:表示unicode字符串 
不是僅僅是針對中文, 可以針對任何的字符串,代表是對字符串進行unicode編碼。 
一般英文字符在使用各種編碼下, 基本都可以正常解析, 所以一般不帶u;但是中文, 必須表明所需編碼, 否則一旦編碼轉換就會出現亂碼。 
建議所有編碼方式采用utf-8,即在py文件開頭添加: # coding: utf-8

例:u"我是含有中文字符組成的字符串。"

作用:后面字符串以 Unicode 格式 進行編碼,一般用在中文字符串前面,防止因為源碼儲存格式問題,導致再次使用時出現亂碼。

字符串前加 r

r/R:非轉義的原始字符串 
與普通字符相比,其他相對特殊的字符,其中可能包含轉義字符,即那些,反斜杠加上對應字母,表示對應的特殊含義的,比如最常見的”\n”表示換行,”\t”表示Tab等。而如果是以r開頭,那么說明后面的字符,都是普通的字符了,即如果是“\n”那么表示一個反斜杠字符,一個字母n,而不是表示換行了。 
以r開頭的字符,常用於正則表達式,對應着re模塊。

例:r"\n\n\n\n”  # 表示一個普通生字符串 \n\n\n\n,而不表示換行了。

作用:去掉反斜杠的轉移機制。

(特殊字符:即那些,反斜杠加上對應字母,表示對應的特殊含義的,比如最常見的”\n”表示換行,”\t”表示Tab等。 )

應用:常用於正則表達式,對應着re模塊。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM