u/U:表示unicode字符串
不是僅僅是針對中文, 可以針對任何的字符串,代表是對字符串進行unicode編碼。
一般英文字符在使用各種編碼下, 基本都可以正常解析, 所以一般不帶u;但是中文, 必須表明所需編碼, 否則一旦編碼轉換就會出現亂碼。
建議所有編碼方式采用utf-8,即在py文件開頭添加: # coding: utf-8
r/R:非轉義的原始字符串
與普通字符相比,其他相對特殊的字符,其中可能包含轉義字符,即那些,反斜杠加上對應字母,表示對應的特殊含義的,比如最常見的”\n”表示換行,”\t”表示Tab等。而如果是以r開頭,那么說明后面的字符,都是普通的字符了,即如果是“\n”那么表示一個反斜杠字符,一個字母n,而不是表示換行了。
以r開頭的字符,常用於正則表達式,對應着re模塊。
注:python3默認編碼方式就是utf-8, 需要注意的是r。
1 a = "hello,\nworld" 2 b = r"hello,\nworld" 3 print("string a:", a) 4 print("string b:", b)
輸出: