Python切片詳解
一、 Python可切片對象的索引方式
包括:正索引和負索引兩部分,如下圖所示,以list對象a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]為例:
二、 Python切片操作的一般方式
1 切片操作基本表達式:object[start_index:end_index:step]
step:正負數均可,其絕對值大小決定了切取數據時的‘‘步長”,而正負號決定了“切取方向”,正表示“從左往右”取值,負表示“從右往左”取值。當step省略時,默認為1,即從左往右以步長1取值。“切取方向非常重要!”“切取方向非常重要!”“切取方向非常重要!”,重要的事情說三遍!
start_index:表示起始索引(包含該索引對應值);該參數省略時,表示從對象“端點”開始取值,至於是從“起點”還是從“終點”開始,則由step參數的正負決定,step為正從“起點”開始,為負從“終點”開始。
end_index:表示終止索引(不包含該索引對應值);該參數省略時,表示一直取到數據“端點”,至於是到“起點”還是到“終點”,同樣由step參數的正負決定,step為正時直到“終點”,為負時直到“起點”
三、 Python切片操作詳細例子
以下示例均以list對象a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]為例:
1 >>>a = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
1. 切取單個元素
1 >>>a[0] 2 >>>0 3 >>>a[-4] 4 >>>6 5 當索引只有一個數時,表示切取某一個元素。
2. 切取完整對象
1 >>>a[:] #從左往右 2 >>> [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 3 >>>a[::]#從左往右 4 >>> [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 5 >>>a[::-1]#從右往左 6 >>> [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
3. start_index和end_index全為正(+)索引的情況
1 >>>a[1:6] 2 >>> [1, 2, 3, 4, 5] 3 step=1,從左往右取值,start_index=1到end_index=6同樣表示從左往右取值。
1 >>>a[1:6:-1] 2 >>> [] 3 輸出為空列表,說明沒取到數據。 4 step=-1,決定了從右往左取值,而start_index=1到end_index=6決定了從左往右取值,兩者矛盾,所以為空。
1 >>>a[6:2] 2 >>> [] 3 同樣輸出為空列表。 4 step=1,決定了從左往右取值,而start_index=6到end_index=2決定了從右往左取值,兩者矛盾,所以為空。
1 >>>a[:6] 2 >>> [0, 1, 2, 3, 4, 5] 3 step=1,表示從左往右取值,而start_index省略時,表示從端點開始,因此這里的端點是“起點”,即從“起點”值0開始一直取到end_index=6(該點不包括)。
1 >>>a[:6:-1] 2 >>> [9, 8, 7] 3 step=-1,從右往左取值,而start_index省略時,表示從端點開始,因此這里的端點是“終點”,即從“終點”值9開始一直取到end_index=6(該點不包括)。
1 >>>a[6:] 2 >>> [6, 7, 8, 9] 3 step=1,從左往右取值,從start_index=6開始,一直取到“終點”值9。
1 >>>a[6::-1] 2 >>> [6, 5, 4, 3, 2, 1, 0] 3 step=-1,從右往左取值,從start_index=6開始,一直取到“起點”0。
4. start_index和end_index全為負(-)索引的情況
1 >>>a[-1:-6] 2 >>> [] 3 step=1,從左往右取值,而start_index=-1到end_index=-6決定了從右往左取值,兩者矛盾,所以為空。 4 索引-1在-6的右邊(如上圖)
1 >>>a[-1:-6:-1] 2 >>> [9, 8, 7, 6, 5] 3 step=-1,從右往左取值,start_index=-1到end_index=-6同樣是從右往左取值。 4 索引-1在6的右邊(如上圖)
1 >>>a[-6:-1] 2 >>> [4, 5, 6, 7, 8] 3 step=1,從左往右取值,而start_index=-6到end_index=-1同樣是從左往右取值。 4 索引-6在-1的左邊(如上圖)
1 >>>a[:-6] 2 >>> [0, 1, 2, 3] 3 step=1,從左往右取值,從“起點”開始一直取到end_index=-6(該點不包括)。
1 >>>a[:-6:-1] 2 >>> [9, 8, 7, 6, 5] 3 step=-1,從右往左取值,從“終點”開始一直取到end_index=-6(該點不包括)。
1 >>>a[-6:] 2 >>> [4, 5, 6, 7, 8, 9] 3 step=1,從左往右取值,從start_index=-6開始,一直取到“終點”。
1 >>>a[-6::-1] 2 >>> [4, 3, 2, 1, 0] 3 step=-1,從右往左取值,從start_index=-6開始,一直取到“起點”。
5. start_index和end_index正(+)負(-)混合索引的情況
1 >>>a[1:-6] 2 >>> [1, 2, 3] 3 start_index=1在end_index=-6的左邊,因此從左往右取值,而step=1同樣決定了從左往右取值,因此結果正確
1 >>>a[1:-6:-1] 2 >>> [] 3 start_index=1在end_index=-6的左邊,因此從左往右取值,但step=-則決定了從右往左取值,兩者矛盾,因此為空。
1 >>>a[-1:6] 2 >>> [] 3 start_index=-1在end_index=6的右邊,因此從右往左取值,但step=1則決定了從左往右取值,兩者矛盾,因此為空。
1 >>>a[-1:6:-1] 2 >>> [9, 8, 7] 3 start_index=-1在end_index=6的右邊,因此從右往左取值,而step=-1同樣決定了從右往左取值,因此結果正確。
6. 多層切片操作
1 >>>a[:8][2:5][-1:] 2 >>> [4] 3 相當於: 4 a[:8]=[0, 1, 2, 3, 4, 5, 6, 7] 5 a[:8][2:5]= [2, 3, 4] 6 a[:8][2:5][-1:] = [4] 7 理論上可無限次多層切片操作,只要上一次返回的是非空可切片對象即可。
7. 切片操作的三個參數可以用表達式
1 >>>a[2+1:3*2:7%3] 2 >>> [3, 4, 5] 3 即:a[2+1:3*2:7%3] = a[3:6:1]
8. 其他對象的切片操作
前面的切片操作以list對象為例進行說明,但實際上可進行切片操作的數據類型還有很多,包括元組、字符串等等。
1 >>> (0, 1, 2, 3, 4, 5)[:3] 2 >>> (0, 1, 2) 3 元組的切片操作
1 >>>'ABCDEFG'[::2] 2 >>>'ACEG' 3 字符串的切片操作
1 >>>for i in range(1,100)[2::3][-5:]: 2 print(i) 3 >>>87 4 90 5 93 6 96 7 99 8 就是利用range()函數生成1-99的整數,然后從start_index=2(即3)開始以step=3取值,直到終點,再在新序列中取最后五個數。
四、 常用切片操作
1.取偶數位置
1 >>>b = a[::2] 2 [0, 2, 4, 6, 8]
2.取奇數位置
1 >>>b = a[1::2] 2 [1, 3, 5, 7, 9]
3.拷貝整個對象
1 >>>b = a[:] # 2 >>>print(b) #[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 3 >>>print(id(a)) #41946376 4 >>>print(id(b)) #41921864 5 或 6 >>>b = a.copy() 7 >>>print(b) #[0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 8 >>>print(id(a)) #39783752 9 >>>print(id(b)) #39759176
需要注意的是:[:]和.copy()都屬於“淺拷貝”,只拷貝最外層元素,內層嵌套元素則通過引用方式共享,而非獨立分配內存,如果需要徹底拷貝則需采用“深拷貝”方式,如下例所示:
1 >>>a = [1,2,['A','B']] 2 >>>print('a={}'.format(a)) 3 >>>b = a[:] 4 >>>b[0] = 9 #修改b的最外層元素,將1變成9 5 >>>b[2][0] = 'D' #修改b的內嵌層元素 6 >>>print('a={}'.format(a)) 7 >>>print('b={}'.format(b)) 8 >>>print('id(a)={}'.format(id(a))) 9 >>>print('id(b)={}'.format(id(b))) 10 a=[1, 2, ['A', 'B']] #原始a 11 a=[1, 2, ['D', 'B']] #b修改內部元素A為D后,a中的A也變成了D,說明共享內部嵌套元素,但外部元素1沒變。 12 b=[9, 2, ['D', 'B']] #修改后的b 13 id(a)=38669128 14 id(b)=38669192
4.修改單個元素
1 >>>a[3] = ['A','B'] 2 [0, 1, 2, ['A', 'B'], 4, 5, 6, 7, 8, 9]
5.在某個位置插入元素
1 >>>a[3:3] = ['A','B','C'] 2 [0, 1, 2, 'A', 'B', 'C', 3, 4, 5, 6, 7, 8, 9] 3 >>>a[0:0] = ['A','B'] 4 ['A', 'B', 0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
6.替換一部分元素
1 >>>a[3:6] = ['A','B'] 2 [0, 1, 2, 'A', 'B', 6, 7, 8, 9]
五、 總結
(一)start_index、end_index、step三者可同為正、同為負,或正負混合。但必須遵循一個原則,即:當start_index表示的實際位置在end_index的左邊時,從左往右取值,此時step必須是正數(同樣表示從左往右);當start_index表示的實際位置在end_index的右邊時,表示從右往左取值,此時step必須是負數(同樣表示從右往左),即兩者的取值順序必須相同。
(二)當start_index或end_index省略時,取值的起始索引和終止索引由step的正負來決定,這種情況不會有取值方向矛盾(即不會返回空列表[]),但正和負取到的結果順序是相反的,因為一個向左一個向右。
(三)step的正負是必須要考慮的,尤其是當step省略時。比如a[-1:],很容易就誤認為是從“終點”開始一直取到“起點”,即a[-1:]= [9, 8, 7, 6, 5, 4, 3, 2, 1, 0],但實際上a[-1:]=[9](注意不是9),原因在於step省略時step=1表示從左往右取值,而起始索引start_index=-1本身就是對象的最右邊元素了,再往右已經沒數據了,因此結果只含有9一個元素。
(四)需要注意:“取單個元素(不帶“:”)”時,返回的是對象的某個元素,其類型由元素本身的類型決定,而與母對象無關,如上面的a[0]=0、a[-4]=6,元素0和6都是“數值型”,而母對象a卻是“list”型;“取連續切片(帶“:”)”時,返回結果的類型與母對象相同,哪怕切取的連續切片只包含一個元素,如上面的a[-1:]=[9],返回的是一個只包含元素“9”的list,而非數值型“9”
作者:馬爾代夫Maldives
鏈接:https://www.jianshu.com/p/15715d6f4dad