Python中的迭代


  在Python中迭代序列(或者其他可迭代對象)時,有一些函數非常好用。有些函數位於itertools模塊中,還有一些Python的內建函數也十分方便。

  1. 並行迭代

  程序可以同時迭代兩個序列。比如有下面兩個列表:

names = ['anne', 'beth', 'george', 'damon']
ages = [12, 45, 32, 102]

  如果想要打印名字和對應的年齡,可以像下面這樣做:

In [7]: for i in range(len(names)):
   ...:     print(names[i], 'is', ages[i], 'years old')
   ...:     
anne is 12 years old
beth is 45 years old
george is 32 years old
damon is 102 years old

  這里 i 是循環索引的標准變量名。

  而內建的zip函數就可以用來進行並行迭代,可以把兩個序列 “壓縮” 在一起,然后返回一個元組的列表:

>>> zip(names, ages)
[('anne', 12), ('beth', 45), ('george', 32), ('damon', 102)]

   現在我可以在循環中解包元組:

In [9]: for name, age in zip(names, ages):
   ...:     print(name, 'is', age, 'years old')
   ...:     
anne is 12 years old
beth is 45 years old
george is 32 years old
damon is 102 years old

  zip 函數也可以作用於任意多的序列。關於它很重要的一點是zip可以處理不等長的序列,當最短的序列 “用完” 的時候就會停止:

 

>>> zip(range(5), xrange(1000000000))
[(0, 0), (1, 1), (2, 2), (3, 3), (4, 4)]

 

   在上面的代碼中,不推薦用range替換xrange——盡管只需要要前5個數字,但range會計算所有的數字,這里要花費很長的時間。而使用xrange就沒有這個問題,它只計算前5個數字。

 

  2. 按索引迭代

  有些時間想要迭代訪問序列中的對象,同時還有獲取當前對象的索引。例如,在一個字符串列表中替換所有包含'xxx'的子字符串。實現的方法肯定有很多,假設你想象下面這樣做:

for string in strings:
    if 'xxx' in string:
        index = strings.index(string)  # Search for the string in the list of strings
        strings[index] = '[censored]'

  沒問題,但是在替換前要搜索給定的字符串似乎沒必要。如果不替換的話,搜索還會返回錯誤的索引(前面出現的同一個詞的索引)。一個比較好的版本如下:

index = 0
for string in strings:
    if 'xxx' in string:
        strings[index] = '[censored]'
    index += 1

  方法有些笨,不過還可以接受。另一種方法是使用內建的enumerate函數:

for index, string in enumerate(strings):
    if 'xxx' in string:
        strings[index] = '[censored]'

  這個函數可以在提供索引的地方迭代索引-值對

 

  3. 翻轉和排序迭代

  讓我們看看另外兩個有用的函數:reversed和sorted。它們同列表的reverse和sort(sorted和sort使用同樣的參數)方法類似,但作用於任何序列或可迭代對象上,不是原地修改對象,而是返回翻轉或排序后的版本:

>>> sorted([4, 3, 6, 8, 3])
[3, 3, 4, 6, 8]
>>> sorted('Hello, world!')
[' ', '!', ',', 'H', 'd', 'e', 'l', 'l', 'l', 'o', 'o', 'r', 'w']
>>> list(reversed('Hello, world!'))
['!', 'd', 'l', 'r', 'o', 'w', ' ', ',', 'o', 'l', 'l', 'e', 'H']
>>> ''.join(reversed('Hello, world!'))
'!dlrow ,olleH'

  注意,雖然sorted方法返回列表,reversed方法卻返回一個更加不可思議的可迭代對象。它們具體的含義不用過多關注,大可在for循環以及join方法中使用,而不會有任何問題。不過卻不能直接對它使用索引、分片以及調用list方法,如果希望進行上述處理,那么可以使用list類型轉換返回的對象,上面的例子中已經給出具體的做法。

 

  4. 迭代器規則

  迭代的意思是重復做一些事很多次,就像在循環中做的那樣。到現在為止只在for循環中對序列和字典進行過迭代,但實際上也能對其他對象進行迭代:只要改對象實現了__iter__方法。

  __iter__方法會返回一個迭代器(iterator),所謂的迭代器就是具有next方法(這個方法在調用時不需要任何參數)的對象。在調用next方法時,迭代器會返回它的下一個值。如果next方法被調用,但迭代器沒有值可以返回,就會引發一個StopIteration異常。


 

注意  迭代器規則在Python 3.0中有一些變化。在新的規則中,迭代器對象應該實現__next__方法,而不是next。而新的內建函數next可以用於訪問這個方法。換句話說,next(it)等同於3.0之前版本中的it.next()。


   迭代規則的關鍵是什么?為什么不使用列表?因為列表的殺傷力太大。如果一個函數,可以一個接一個地計算值,那么在使用時可能是計算一個值時獲取一個值——而不是通過列表一次性獲取所有值。如果有很多值,列表就會占用太多的內存。但還有其他的理由:使用迭代器更通用、更簡單、更優雅。讓我們看看一個不使用列表的例子,因為要用的話,列表的長度必須無限。

  這里的“列表”是一個斐波那契數列。使用的迭代器如下:

In [1]: class Fibs:
   ...:     def __init__(self):
   ...:         self.a = 0
   ...:         self.b = 1
   ...:     def next(self):
   ...:         self.a, self.b = self.b, self.a + self.b
   ...:         return self.a
   ...:     def __iter__(self):
   ...:         return self

  注意,迭代器實現了__iter__方法,這個方法實際上返回迭代器本身。在很多情況下,__iter__會放到其他的會在for循環中使用的對象中。這樣一來,程序就能返回所需的迭代器。此外,推薦使用迭代器實現它自己的__iter__方法,然后就能直接在for循環中使用迭代器本身了。


 

注意  正式的說法是,一個實現了__iter__方法的對象是可迭代的,一個實現了next方法的對象則是迭代器。


  首先,產生一個Fibs對象:

In [2]: fibs = Fibs()

 

  可在for循環中使用該對象——比如去查找在斐波那契數列中比1000大的數中的最小的數:

In [3]: for f in fibs:
   ...:     if f > 1000:
   ...:         print f
   ...:         break

1597

  因為設置了break,所以循環在這里停止了,否則循環會一直繼續下去。


 

 

提示 內建函數iter可以從可迭代的對象中獲得迭代器。

>>> it = iter([1, 2, 3])
>>> it.next()
1
>>> it.next()
2

 

  除此之外,它也可以從函數或者其他可調用對象中獲取可迭代對象。


 

 

  5. 從迭代器得到序列

  除了在迭代器和可迭代對象上進行迭代外,還能把它們轉換為序列。在大部分能使用序列的情況下(除了或者分片等操作中),都能使用迭代器(或者可迭代對象)替換。關於這個的一個很有用的例子是使用list構造方法顯示地將迭代器轉化為列表。

 

>>> class TestIterator:
...     value = 0
...     def next(self):
...             self.value += 1
...             if self.value > 10: 
...                 raise StopIteration
...             return self.value
...     def __iter__(self):
...             return self
... 
>>> ti = TestIterator()
>>> list(ti)
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

 

 

 

    

  

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM