python 高級特性


from http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e542c000

set

set和dict類似,也是一組key的集合,但不存儲value。由於key不能重復,所以,在set中,沒有重復的key。

要創建一個set,需要提供一個list作為輸入集合:

>>> s = set([1, 2, 3]) >>> s {1, 2, 3} 

注意,傳入的參數[1, 2, 3]是一個list,而顯示的{1, 2, 3}只是告訴你這個set內部有1,2,3這3個元素,顯示的順序也不表示set是有序的。。

重復元素在set中自動被過濾:

>>> s = set([1, 1, 2, 2, 3, 3]) >>> s {1, 2, 3} 

通過add(key)方法可以添加元素到set中,可以重復添加,但不會有效果:

>>> s.add(4) >>> s {1, 2, 3, 4} >>> s.add(4) >>> s {1, 2, 3, 4} 

通過remove(key)方法可以刪除元素:

>>> s.remove(4) >>> s {1, 2, 3} 

set可以看成數學意義上的無序和無重復元素的集合,因此,兩個set可以做數學意義上的交集、並集等操作:

>>> s1 = set([1, 2, 3]) >>> s2 = set([2, 3, 4]) >>> s1 & s2 {2, 3} >>> s1 | s2 {1, 2, 3, 4} 

set和dict的唯一區別僅在於沒有存儲對應的value,但是,set的原理和dict一樣,所以,同樣不可以放入可變對象,因為無法判斷兩個可變對象是否相等,也就無法保證set內部“不會有重復元素”。試試把list放入set,看看是否會報錯。

再議不可變對象

上面我們講了,str是不變對象,而list是可變對象。

對於可變對象,比如list,對list進行操作,list內部的內容是會變化的,比如:

>>> a = ['c', 'b', 'a'] >>> a.sort() >>> a ['a', 'b', 'c'] 

而對於不可變對象,比如str,對str進行操作呢:

>>> a = 'abc' >>> a.replace('a', 'A') 'Abc' >>> a 'abc' 

雖然字符串有個replace()方法,也確實變出了'Abc',但變量a最后仍是'abc',應該怎么理解呢?

我們先把代碼改成下面這樣:

>>> a = 'abc' >>> b = a.replace('a', 'A') >>> b 'Abc' >>> a 'abc' 

要始終牢記的是,a是變量,而'abc'才是字符串對象!有些時候,我們經常說,對象a的內容是'abc',但其實是指,a本身是一個變量,它指向的對象的內容才是'abc'

a-to-str

當我們調用a.replace('a', 'A')時,實際上調用方法replace是作用在字符串對象'abc'上的,而這個方法雖然名字叫replace,但卻沒有改變字符串'abc'的內容。相反,replace方法創建了一個新字符串'Abc'並返回,如果我們用變量b指向該新字符串,就容易理解了,變量a仍指向原有的字符串'abc',但變量b卻指向新字符串'Abc'了:

a-b-to-2-strs

所以,對於不變對象來說,調用對象自身的任意方法,也不會改變該對象自身的內容。相反,這些方法會創建新的對象並返回,這樣,就保證了不可變對象本身永遠是不可變的。

小結

使用key-value存儲結構的dict在Python中非常有用,選擇不可變對象作為key很重要,最常用的key是字符串。

tuple雖然是不變對象,但試試把(1, 2, 3)(1, [2, 3])放入dict或set中,並解釋結果。

 

切片:

L = ['Michael', 'Sarah', 'Tracy', 'Bob', 'Jack']

Python支持L[-1]取倒數第一個元素,那么它同樣支持倒數切片

>>> L[-2:] ['Bob', 'Jack'] >>> L[-2:-1] ['Bob']

創建一個0-99的數列:

>>> L = list(range(100)) #range(100)返回一個list >>> L [0, 1, 2, 3, ..., 99] 

可以通過切片輕松取出某一段數列。比如前10個數:

>>> L[:10] [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] 

后10個數:

>>> L[-10:] [90, 91, 92, 93, 94, 95, 96, 97, 98, 99] 

前11-20個數:

>>> L[10:20] [10, 11, 12, 13, 14, 15, 16, 17, 18, 19] 

前10個數,每兩個取一個:

>>> L[:10:2] [0, 2, 4, 6, 8] 

所有數,每5個取一個:

>>> L[::5] [0, 5, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95] 

甚至什么都不寫,只寫[:]就可以原樣復制一個list:

>>> L[:] [0, 1, 2, 3, ..., 99] 

tuple也是一種list,唯一區別是tuple不可變。因此,tuple也可以用切片操作,只是操作的結果仍是tuple:

>>> (0, 1, 2, 3, 4, 5)[:3] (0, 1, 2) 

字符串'xxx'也可以看成是一種list,每個元素就是一個字符。因此,字符串也可以用切片操作,只是操作結果仍是字符串:

>>> 'ABCDEFG'[:3] 'ABC' >>> 'ABCDEFG'[::2] 'ACEG' 

 

如何判斷一個對象是可迭代對象呢?方法是通過collections模塊的Iterable類型判斷:

>>> from collections import Iterable >>> isinstance('abc', Iterable) # str是否可迭代 True >>> isinstance([1,2,3], Iterable) # list是否可迭代 True >>> isinstance(123, Iterable) # 整數是否可迭代 False 

最后一個小問題,如果要對list實現類似Java那樣的下標循環怎么辦?Python內置的enumerate函數可以把一個list變成索引-元素對,這樣就可以在for循環中同時迭代索引和元素本身:

>>> for i, value in enumerate(['A', 'B', 'C']): ... print(i, value) ... 0 A 1 B 2 C 

上面的for循環里,同時引用了兩個變量,在Python里是很常見的,比如下面的代碼:

>>> for x, y in [(1, 1), (2, 4), (3, 9)]: ... print(x, y) ... 1 1 2 4 3 9

列表生成式:

列表生成式即List Comprehensions,是Python內置的非常簡單卻強大的可以用來創建list的生成式。

 
        

舉個例子,要生成list [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]可以用list(range(1, 11))

 
        
>>> list(range(1, 11)) [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 
 
        

但如果要生成[1x1, 2x2, 3x3, ..., 10x10]怎么做?方法一是循環:

 
        
>>> L = [] >>> for x in range(1, 11): ... L.append(x * x) ... >>> L [1, 4, 9, 16, 25, 36, 49, 64, 81, 100] 
 
        

但是循環太繁瑣,而列表生成式則可以用一行語句代替循環生成上面的list:

 
        
>>> [x * x for x in range(1, 11)] [1, 4, 9, 16, 25, 36, 49, 64, 81, 100] 
 
        

寫列表生成式時,把要生成的元素x * x放到前面,后面跟for循環,就可以把list創建出來,十分有用,多寫幾次,很快就可以熟悉這種語法。

 
        

for循環后面還可以加上if判斷,這樣我們就可以篩選出僅偶數的平方:

 
        
>>> [x * x for x in range(1, 11) if x % 2 == 0] [4, 16, 36, 64, 100] 
 
        

還可以使用兩層循環,可以生成全排列:

 
        
>>> [m + n for m in 'ABC' for n in 'XYZ'] ['AX', 'AY', 'AZ', 'BX', 'BY', 'BZ', 'CX', 'CY', 'CZ'] 
 
        

三層和三層以上的循環就很少用到了。

 
        

運用列表生成式,可以寫出非常簡潔的代碼。例如,列出當前目錄下的所有文件和目錄名,可以通過一行代碼實現:

 
        
>>> import os # 導入os模塊,模塊的概念后面講到 >>> [d for d in os.listdir('.')] # os.listdir可以列出文件和目錄 ['.emacs.d', '.ssh', '.Trash', 'Adlm', 'Applications', 'Desktop', 'Documents', 'Downloads', 'Library', 'Movies', 'Music', 'Pictures', 'Public', 'VirtualBox VMs', 'Workspace', 'XCode'] 
 
        

for循環其實可以同時使用兩個甚至多個變量,比如dictitems()可以同時迭代key和value:

 
        
>>> d = {'x': 'A', 'y': 'B', 'z': 'C' } >>> for k, v in d.items(): ... print(k, '=', v) ... y = B x = A z = C 
 
        

因此,列表生成式也可以使用兩個變量來生成list:

 
        
>>> d = {'x': 'A', 'y': 'B', 'z': 'C' } >>> [k + '=' + v for k, v in d.items()] ['y=B', 'x=A', 'z=C'] 
 
        

最后把一個list中所有的字符串變成小寫:

 
        
>>> L = ['Hello', 'World', 'IBM', 'Apple'] >>> [s.lower() for s in L] ['hello', 'world', 'ibm', 'apple'] 
 
        
生成器


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM