u/U:表示unicode字符串
不是僅僅是針對中文, 可以針對任何的字符串,代表是對字符串進行unicode編碼。
一般英文字符在使用各種編碼下, 基本都可以正常解析, 所以一般不帶u;但是中文, 必須表明所需編碼, 否則一旦編碼轉換就會出現亂碼。 建議所有編碼方式采用utf8。在python3中,字符串默認創建即以Unicode編碼存儲,可以存儲中文。
例子一:
u"我是含有中文字符組成的字符串。"
作用:
后面字符串以 Unicode 格式 進行編碼,一般用在中文字符串前面,防止因為源碼儲存格式問題,導致再次使用時出現亂碼。
例子二:
string = 'a' 等效於 string = u'a'
Unicode中通常每個字符由2個字節表示。
u'a' 即 u'\u0061' 實際內存中為 [0000 0000] [0110 0001]
r/R:表示非轉義的原始字符串。
與普通字符相比,其他相對特殊的字符,其中可能包含轉義字符,即那些反斜杠加上對應字母,表示對應的特殊含義的,比如最常見的”\n”表示換行,”\t”表示Tab等。而如果是以r開頭,那么說明后面的字符,都是普通的字符了,即如果是“\n”那么表示一個反斜杠字符,一個字母n,而不是表示換行了。
以r開頭的字符,常用於正則表達式,對應着re模塊。
例:r"\n\n\n\n” # 表示一個普通生字符串 \n\n\n\n,而不表示換行了。
作用:
去掉反斜杠的轉移機制。(特殊字符:即那些,反斜杠加上對應字母,表示對應的特殊含義的,比如最常見的”\n”表示換行,”\t”表示Tab等。 )
應用:
常用於正則表達式,對應着re模塊。
b:表示bytes類型字符串
python3.x里,默認的str是(py2.x里的)unicode,bytes是(py2.x)的str,b”“前綴代表的就是bytes。
python2.x里,b前綴沒什么具體意義, 只是為了兼容python3.x的這種寫法。
**例子一: **
response = b'<h1>Hello World!</h1>' # b' ' 表示這是一個 bytes 對象
作用:
b" "前綴表示:后面字符串是bytes 類型。
用處:
網絡編程中,服務器和瀏覽器只認bytes 類型數據。如:send 函數的參數和 recv 函數的返回值都是 bytes 類型。
例子二:
字符串存儲為Ascll碼,無法存儲中文。
result = b'你好20190101'
編譯會報如下錯誤:
SyntaxError: bytes can only contain ASCII literal characters.
每個字符由1個字節表示(8位)
b'a'即b'\x61' 實際內存中位 [0110 0001]
附:
在 Python3 中,bytes 和 str 的互相轉換方式是
str.encode('utf-8')
bytes.decode('utf-8')
print(r'A\tA') 結果為A\tA
print(b'A\tA') 結果為b'A\tA'
print(u'A\tA') 結果為A A
注意:b'A\tA' 打印結果中自帶一個b'',表示該字符串是一個字節數組。