1.實現generator的兩種方式
python中的generator保存的是算法,真正需要計算出值的時候才會去往下計算出值。它是一種惰性計算(lazy evaluation)。
要創建一個generator有兩種方式。
第一種方法:把一個列表生成式的[]
改成()
,就創建了一個generator:
>>> L = [x * x for x in range(10)] >>> L [0, 1, 4, 9, 16, 25, 36, 49, 64, 81] >>> g = (x * x for x in range(10)) # 注意把[]改成()后,不是生成一個tuple,而是生成一個generator >>> g <generator object <genexpr> at 0x1022ef630>
第二種方式:在函數中使用yield關鍵字,函數就變成了一個generator。
函數里有了yield后,執行到yield就會停住,當需要再往下算時才會再往下算。所以生成器函數即使是有無限循環也沒關系,它需要算到多少就會算多少,不需要就不往下算。
def fib():
a, b = 0, 1
while True:
yield a
a, b = b, a + b
f = fib()
print f, next(f), next(f), next(f)
# <generator object fib at 0x7f89769d1fa0> 0 1 1
如上例,第一次輸出f,它就是一個generator,之后每次next,它就執行到yield a。
當然其實平常很少用到next(),我們直接用for循環就可以遍歷一個generator,其實for循環的內部實現就是不停調用next()。
生成器可以避免不必要的計算,帶來性能上的提升;而且會節約空間,可以實現無限循環(無窮大的)的數據結構。
2.可迭代對象(Iterable)和迭代器(Iterator)的概念
可以直接作用於for
循環的對象統稱為可迭代對象:Iterable
。
包括集合數據類型(list
、tuple
、dict
、set
、str
等)和生成器(generator)。
可以使用isinstance()
判斷一個對象是否是Iterable
對象。
>>> from collections import Iterable >>> isinstance([], Iterable) True >>> isinstance({}, Iterable) True >>> isinstance('abc', Iterable) True >>> isinstance((x for x in range(10)), Iterable) True >>> isinstance(100, Iterable) False
迭代器:Iterator。
它表示的是一個數據流,Iterator對象可以被next()
函數調用並不斷返回下一個數據,直到沒有數據時拋出StopIteration
錯誤。可以把這個數據流看做是一個有序序列,但我們卻不能提前知道序列的長度,只能不斷通過next()
函數實現按需計算下一個數據,所以Iterator
的計算是惰性的,只有在需要返回下一個數據時它才會計算。Iterator
甚至可以表示一個無限大的數據流,例如全體自然數。而使用list是永遠不可能存儲全體自然數的。
生成器(generator)都是Iterator
對象,但list
、dict
、str
雖然是Iterable
,卻不是Iterator
。
把list
、dict
、str
等Iterable
變成Iterator
可以使用iter()
函數:
>>> isinstance(iter([]), Iterator) True >>> isinstance(iter('abc'), Iterator) True
Python的for
循環本質上就是通過不斷調用next()
函數實現的,例如:
for x in [1, 2, 3, 4, 5]: pass
實際上完全等價於:
# 首先獲得Iterator對象: it = iter([1, 2, 3, 4, 5]) # 循環: while True: try: # 獲得下一個值: x = next(it) except StopIteration: # 遇到StopIteration就退出循環 break
3.itertools模塊
python的內置模塊itertools提供了用於操作迭代對象的函數,非常方便實用。舉一個例子:
islice(iterable, [start, ] stop [, step]):
創建一個迭代器,生成項的方式類似於切片返回值: iterable[start : stop : step],將跳過前start個項,迭代在stop所指定的位置停止,step指定用於跳過項的步幅。與切片不同,負值不會用於任何start,stop和step,如果省略了start,迭代將從0開始,如果省略了step,步幅將采用1.
from itertools import islice def fib(): a, b = 0, 1 while True: yield a a, b = b, a + b f = fib() print list(islice(f, 10))
# [0, 1, 1, 2, 3, 5, 8, 13, 21, 34]