Python3 字符串

字符串是 Python 中最常用的數據類型。我們可以使用引號('或")來創建字符串。

創建字符串很簡單，只要為變量分配一個值即可。例如：

var1 = 'Hello World!'
var2 = "Runoob"

Python 訪問字符串中的值

Python 不支持單字符類型，單字符也在Python也是作為一個字符串使用。

Python 訪問子字符串，可以使用方括號來截取字符串，如下實例：

實例(Python 3.0+)

#!/usr/bin/python3
 
var1 = 'Hello World!'
var2 = "Runoob"
 
print ("var1[0]: ", var1[0])
print ("var2[1:5]: ", var2[1:5])

以上實例執行結果：

var1[0]:  H
var2[1:5]:  unoo

Python字符串更新

你可以截取字符串的一部分並與其他字段拼接，如下實例：

實例(Python 3.0+)

#!/usr/bin/python3
 
var1 = 'Hello World!'
 
print ("已更新字符串 : ", var1[:6] + 'Runoob!')

以上實例執行結果

已更新字符串 :  Hello Runoob!

Python轉義字符

在需要在字符中使用特殊字符時，python用反斜杠(\)轉義字符。如下表：

轉義字符	描述
\(在行尾時)	續行符
\\	反斜杠符號
\'	單引號
\"	雙引號
\a	響鈴
\b	退格(Backspace)
\e	轉義
\000	空
\n	換行
\v	縱向制表符
\t	橫向制表符
\r	回車
\f	換頁
\oyy	八進制數，yy代表的字符，例如：\o12代表換行
\xyy	十六進制數，yy代表的字符，例如：\x0a代表換行
\other	其它的字符以普通格式輸出

Python字符串運算符

下表實例變量a值為字符串 "Hello"，b變量值為 "Python"：

操作符	描述	實例
+	字符串連接	a + b 輸出結果： HelloPython
*	重復輸出字符串	a*2 輸出結果：HelloHello
[]	通過索引獲取字符串中字符	a[1] 輸出結果 e
[ : ]	截取字符串中的一部分	a[1:4] 輸出結果 ell
in	成員運算符 - 如果字符串中包含給定的字符返回 True	H in a 輸出結果 1
not in	成員運算符 - 如果字符串中不包含給定的字符返回 True	M not in a 輸出結果 1
r/R	原始字符串 - 原始字符串：所有的字符串都是直接按照字面的意思來使用，沒有轉義特殊或不能打印的字符。原始字符串除在字符串的第一個引號前加上字母"r"（可以大小寫）以外，與普通字符串有着幾乎完全相同的語法。	print r'\n' prints \n 和 print R'\n'prints \n
%	格式字符串	請看下一節內容。

實例(Python 3.0+)

#!/usr/bin/python3
 
a = "Hello"
b = "Python"
 
print("a + b 輸出結果：", a + b)
print("a * 2 輸出結果：", a * 2)
print("a[1] 輸出結果：", a[1])
print("a[1:4] 輸出結果：", a[1:4])
 
if( "H" in a) :
    print("H 在變量 a 中")
else :
    print("H 不在變量 a 中")
 
if( "M" not in a) :
    print("M 不在變量 a 中")
else :
    print("M 在變量 a 中")
 
print (r'\n')
print (R'\n')

以上實例輸出結果為：

a + b 輸出結果： HelloPython
a * 2 輸出結果： HelloHello
a[1] 輸出結果： e
a[1:4] 輸出結果： ell
H 在變量 a 中
M 不在變量 a 中
\n
\n

Python字符串格式化

Python 支持格式化字符串的輸出。盡管這樣可能會用到非常復雜的表達式，但最基本的用法是將一個值插入到一個有字符串格式符 %s 的字符串中。

在 Python 中，字符串格式化使用與 C 中 sprintf 函數一樣的語法。

實例(Python 3.0+)

#!/usr/bin/python3
 
print ("我叫 %s 今年 %d 歲!" % ('小明', 10))

以上實例輸出結果：

我叫 小明 今年 10 歲!

python字符串格式化符號:

符號	描述
%c	格式化字符及其ASCII碼
%s	格式化字符串
%d	格式化整數
%u	格式化無符號整型
%o	格式化無符號八進制數
%x	格式化無符號十六進制數
%X	格式化無符號十六進制數（大寫）
%f	格式化浮點數字，可指定小數點后的精度
%e	用科學計數法格式化浮點數
%E	作用同%e，用科學計數法格式化浮點數
%g	%f和%e的簡寫
%G	%f 和 %E 的簡寫
%p	用十六進制數格式化變量的地址

格式化操作符輔助指令:

符號	功能
*	定義寬度或者小數點精度
-	用做左對齊
+	在正數前面顯示加號( + )
<sp>	在正數前面顯示空格
#	在八進制數前面顯示零('0')，在十六進制前面顯示'0x'或者'0X'(取決於用的是'x'還是'X')
0	顯示的數字前面填充'0'而不是默認的空格
%	'%%'輸出一個單一的'%'
(var)	映射變量(字典參數)
m.n.	m 是顯示的最小總寬度,n 是小數點后的位數(如果可用的話)

Python2.6 開始，新增了一種格式化字符串的函數 str.format()，它增強了字符串格式化的功能。

Python三引號

python三引號允許一個字符串跨多行，字符串中可以包含換行符、制表符以及其他特殊字符。實例如下

實例(Python 3.0+)

#!/usr/bin/python3
 
para_str = """這是一個多行字符串的實例
多行字符串可以使用制表符
TAB ( \t )。
也可以使用換行符 [ \n ]。
"""
print (para_str)

以上實例執行結果為：

這是一個多行字符串的實例
多行字符串可以使用制表符
TAB (    )。
也可以使用換行符 [ 
 ]。

三引號讓程序員從引號和特殊字符串的泥潭里面解脫出來，自始至終保持一小塊字符串的格式是所謂的WYSIWYG（所見即所得）格式的。

一個典型的用例是，當你需要一塊HTML或者SQL時，這時用字符串組合，特殊字符串轉義將會非常的繁瑣。

errHTML = '''
<HTML><HEAD><TITLE>
Friends CGI Demo</TITLE></HEAD>
<BODY><H3>ERROR</H3>
<B>%s</B><P>
<FORM><INPUT TYPE=button VALUE=Back
ONCLICK="window.history.back()"></FORM>
</BODY></HTML>
'''
cursor.execute('''
CREATE TABLE users (  
login VARCHAR(8), 
uid INTEGER,
prid INTEGER)
''')

Unicode 字符串

在Python2中，普通字符串是以8位ASCII碼進行存儲的，而Unicode字符串則存儲為16位unicode字符串，這樣能夠表示更多的字符集。使用的語法是在字符串前面加上前綴 u。

在Python3中，所有的字符串都是Unicode字符串。

Python 的字符串內建函數

Python 的字符串常用內建函數如下：

序號	方法及描述
1	capitalize() 將字符串的第一個字符轉換為大寫
2	center(width, fillchar) 返回一個指定的寬度 width 居中的字符串，fillchar 為填充的字符，默認為空格。
3	count(str, beg= 0,end=len(string)) 返回 str 在 string 里面出現的次數，如果 beg 或者 end 指定則返回指定范圍內 str 出現的次數
4	bytes.decode(encoding="utf-8", errors="strict") Python3 中沒有 decode 方法，但我們可以使用 bytes 對象的 decode() 方法來解碼給定的 bytes 對象，這個 bytes 對象可以由 str.encode() 來編碼返回。
5	encode(encoding='UTF-8',errors='strict') 以 encoding 指定的編碼格式編碼字符串，如果出錯默認報一個ValueError 的異常，除非 errors 指定的是'ignore'或者'replace'
6	endswith(suffix, beg=0, end=len(string)) 檢查字符串是否以 obj 結束，如果beg 或者 end 指定則檢查指定的范圍內是否以 obj 結束，如果是，返回 True,否則返回 False.
7	expandtabs(tabsize=8) 把字符串 string 中的 tab 符號轉為空格，tab 符號默認的空格數是 8 。
8	find(str, beg=0 end=len(string)) 檢測 str 是否包含在字符串中，如果指定范圍 beg 和 end ，則檢查是否包含在指定范圍內，如果包含返回開始的索引值，否則返回-1
9	index(str, beg=0, end=len(string)) 跟find()方法一樣，只不過如果str不在字符串中會報一個異常.
10	isalnum() 如果字符串至少有一個字符並且所有字符都是字母或數字則返回 True,否則返回 False
11	isalpha() 如果字符串至少有一個字符並且所有字符都是字母則返回 True, 否則返回 False
12	isdigit() 如果字符串只包含數字則返回 True 否則返回 False..
13	islower() 如果字符串中包含至少一個區分大小寫的字符，並且所有這些(區分大小寫的)字符都是小寫，則返回 True，否則返回 False
14	isnumeric() 如果字符串中只包含數字字符，則返回 True，否則返回 False
15	isspace() 如果字符串中只包含空白，則返回 True，否則返回 False.
16	istitle() 如果字符串是標題化的(見 title())則返回 True，否則返回 False
17	isupper() 如果字符串中包含至少一個區分大小寫的字符，並且所有這些(區分大小寫的)字符都是大寫，則返回 True，否則返回 False
18	join(seq) 以指定字符串作為分隔符，將 seq 中所有的元素(的字符串表示)合並為一個新的字符串
19	len(string) 返回字符串長度
20	ljust(width[, fillchar]) 返回一個原字符串左對齊,並使用 fillchar 填充至長度 width 的新字符串，fillchar 默認為空格。
21	lower() 轉換字符串中所有大寫字符為小寫.
22	lstrip() 截掉字符串左邊的空格或指定字符。
23	maketrans() 創建字符映射的轉換表，對於接受兩個參數的最簡單的調用方式，第一個參數是字符串，表示需要轉換的字符，第二個參數也是字符串表示轉換的目標。
24	max(str) 返回字符串 str 中最大的字母。
25	min(str) 返回字符串 str 中最小的字母。
26	replace(old, new [, max]) 把將字符串中的 str1 替換成 str2,如果 max 指定，則替換不超過 max 次。
27	rfind(str, beg=0,end=len(string)) 類似於 find()函數，不過是從右邊開始查找.
28	rindex( str, beg=0, end=len(string)) 類似於 index()，不過是從右邊開始.
29	rjust(width,[, fillchar]) 返回一個原字符串右對齊,並使用fillchar(默認空格）填充至長度 width 的新字符串
30	rstrip() 刪除字符串字符串末尾的空格.
31	split(str="", num=string.count(str)) num=string.count(str)) 以 str 為分隔符截取字符串，如果 num 有指定值，則僅截取 num 個子字符串
32	splitlines([keepends]) 按照行('\r', '\r\n', \n')分隔，返回一個包含各行作為元素的列表，如果參數 keepends 為 False，不包含換行符，如果為 True，則保留換行符。
33	startswith(str, beg=0,end=len(string)) 檢查字符串是否是以 obj 開頭，是則返回 True，否則返回 False。如果beg 和 end 指定值，則在指定范圍內檢查。
34	strip([chars]) 在字符串上執行 lstrip()和 rstrip()
35	swapcase() 將字符串中大寫轉換為小寫，小寫轉換為大寫
36	title() 返回"標題化"的字符串,就是說所有單詞都是以大寫開始，其余字母均為小寫(見 istitle())
37	translate(table, deletechars="") 根據 str 給出的表(包含 256 個字符)轉換 string 的字符, 要過濾掉的字符放到 deletechars 參數中
38	upper() 轉換字符串中的小寫字母為大寫
39	zfill (width) 返回長度為 width 的字符串，原字符串右對齊，前面填充0
40	isdecimal() 檢查字符串是否只包含十進制字符，如果是返回 true，否則返回 false。

字符串截取字符補充：

# 0、a,b為參數。從字符串指針為a的地方開始截取字符，到b的前一個位置（因為不包含b）
var1 = "hello world";
print(var1[a: b]);

# 1、如果a,b均不填寫，默認取全部字符。即，下面這兩個打印結果是一樣的
print(var1[: ]);  # hello world
print(var1);      # hello world

# 2、如果a填寫，b不填寫（或填寫的值大於指針下標），默認從a開始截取，至字符串最后一個位置
print(var1[3: ]); # lo world

# 3、如果a不填寫， b填寫，默認從0位置開始截取，至b的前一個位置
print(var1[: 8]); # hello wo

# 4、如果a為負數，默認從尾部某一位置，開始向后截取
print(var1[-2: ]); # ld

# 5、如果a>=b, 默認輸出為空。
print(var1[3: 3]);
print(var1[3: 2]);

python字符串格式化符號 %f 可指定小數點后的精度。

>>> num=18.7254
>>> print("the price  is  %.2f" %num)
the price  is  18.73
>>>

%g 是 %f 和 %e 的簡寫是什么意思？到底是 %f 還是 %e？

對此我用代碼測試了一下：

>>> a=100000
>>> print("%g"%(a))
100000
>>> a=10000000
>>> print("%g"%(a))
1e+07
>>> a=1000000
>>> print("%g"%(a))
1e+06

可以發現，%g 是自動選擇輸出格式的，在六位數的情況下就會以科學計數法方式輸出，文章中說 %g 是 %f 和 %e 的簡寫，但是我發現上述不是科學計數法方式輸出的時候輸出的是一個整數，於是又進行了如下測試：

>>> a=100000.0
>>> print("%g"%(a))
100000
>>> print("%f"%(a))
100000.000000
>>>

發現 %g 在不是用 %e 輸出的情況下和%f還是有區別的

對此我又做了如下測試：

>>> a=100000.1
>>> print("%g"%(a))
100000
>>> a=1.0
>>> print("%g"%(a))
1
>>> a=1.1
>>> print("%g"%(a))
1.1

發現在 a=100000.1 的時候輸出的數並沒有小數點后面的 1，對此我對比了 C 語言 %g 的格式輸出，猜想 python 中應該如同 C 語言一樣，%g 用於打印數據時，會去掉多余的零，至多保留六位有效數字。

使用格式化符號進行進制轉換

>>> num=10
>>> print('十六進制：%#x' % num)    #使用%x將十進制num格式化為十六進制
十六進制：0xa
>>> print('二進制:', bin(num))      #使用bin將十進制num格式化為二進制
二進制: 0b1010
>>> print('八進制：%#o' % num)      #使用%o將十進制num格式化為八進制
八進制：0o12

上面使用格式化符號進行進制轉換中，多加入了一個#號，目的是在轉換結果頭部顯示當前進制類型，如不需要，可將#號去除，如下

>>> print('八進制：%o' % num)
八進制：12
>>> print('十六進制：%x' % num)
十六進制：a

字符串截取字符繼續補充:

[::2] 表示的是從頭到尾，步長為2。第一個冒號兩側的數字是指截取字符串的范圍,第二個冒號后面是指截取的步長。

>>> L=['a','b','c','d','e','f','g']
>>> print(L[::2]) 
['a', 'c', 'e', 'g']

可以使用負數從字符串右邊末尾向左邊反向索引，最右側索引值是 -1:

>>> str = "runoob"
>>> str[-4]
'n'
>>>

字符串的分割還有partition()這種方式。

partition(sep)  --> (head,sep,tail)

從左向右遇到分隔符把字符串分割成兩部分，返回頭、分割符、尾三部分的三元組。如果沒有找到分割符，就返回頭、尾兩個空元素的三元組。

s1 = "I'm a good sutdent."
#以'good'為分割符，返回頭、分割符、尾三部分。
s2 = s1.partition('good')
#沒有找到分割符'abc'，返回頭、尾兩個空元素的元組。
s3 = s1.partition('abc')

print(s1)
print(s2)
print(s3)

結果如下：

I'm a good sutdent.
("I'm a ", 'good', ' sutdent.')

("I'm a good sutdent.", '', '')