最近開始學習爬蟲框架Scrapy,看大牛寫的博客時,發現有段代碼不知道如何理解,對,就是它:關鍵字yield該怎么理解?
在詳細查詢了文檔說明后,得出以下結論:
一個帶有 yield 的函數就是一個 generator,它和普通函數不同,生成一個 generator 看起來像函數調用,但不會執行任何函數代碼,直到對其調用 next()(在 for 循環中會自動調用 next())才開始執行。雖然執行流程仍按函數的流程執行,但每執行到一個 yield 語句就會中斷,並返回一個迭代值,下次執行時從 yield 的下一個語句繼續執行。看起來就好像一個函數在正常執行的過程中被 yield 中斷了數次,每次中斷都會通過 yield 返回當前的迭代值。
yield 的好處是顯而易見的,把一個函數改寫為一個 generator 就獲得了迭代能力,比起用類的實例保存狀態來計算下一個 next() 的值,不僅代碼簡潔,而且執行流程異常清晰。
用下面的一段代碼就非常好理解了。
若用next()分開執行代碼(python2用next(),python3用__next__()),
當函數執行結束時,generator 自動拋出 StopIteration 異常,表示迭代完成。在 for 循環里,無需處理 StopIteration 異常,循環會正常結束。
所以優點就是利用迭代,減少內存消耗,代碼更簡潔;
return返回值,在第一次調用函數,yield返回迭代對象;
在一個 generator function 中,如果沒有 return,則默認執行至函數完畢,如果在執行過程中 return,則直接拋出 StopIteration 終止迭代。
最后,還看到有人用yield 做文件讀取。如果直接對文件對象調用 read() 方法,會導致不可預測的內存占用。好的方法是利用固定長度的緩沖區來不斷讀取文件內容。通過 yield,不再需要編寫讀文件的迭代類,就可以輕松實現文件讀取