Python 高級編程:理解生成器

生成器是 Python 初級開發者最難理解的概念之一,雖被認為是 Python 編程中的高級技能,但在各種項目中可以隨處見到生成器的身影,你得不得去理解它、使用它、甚至愛上它。

提到生成器,總不可避免地要把迭代器拉出來對比著講,生成器就是一個在行為上和迭代器非常類似的對象,如果把迭代器比作 Android 系統,那麼生成器就是 iOS,二者功能上差不多,但是生成器更優雅。

什麼是迭代器

顧名思義,迭代器就是用於迭代操作(for 循環)的對象,它像列表一樣可以迭代獲取其中的每一個元素,任何實現了 __next__ 方法

(python2 是 next)的對象都可以稱為迭代器。

它與列表的區別在於,構建迭代器的時候,不像列表把所有元素一次性載入到內存,而是以一種延遲計算(lazy evaluation)方式返回元素,這正是它的優點。比如列表含有中一千萬個整數,需要佔超過400M的內存,而迭代器只需要幾十個位元組的空間。因為它並沒有把所有元素裝載到內存中,而是等到調用 next 方法時候才返回該元素(按需調用 call by need 的方式,本質上 for 循環就是不斷地調用迭代器的next方法)。

以斐波那契數列為例來實現一個迭代器:

class Fib: def __init__(self, n): self.prev = 0 self.cur = 1 self.n = n def __iter__(self): return self def __next__(self): if self.n > 0: value = self.cur self.cur = self.cur + self.prev self.prev = value self.n -= 1 return value else: raise StopIteration() # 兼容python2 def __next__(self): return self.next()f = Fib(10)print([i for i in f])#[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

什麼是生成器

知道迭代器之後,就可以正式進入生成器的話題了。普通函數用 return 返回一個值,和 Java 等其他語言是一樣的,然而在 Python 中還有一種函數,用關鍵字 yield 來返回值,這種函數叫生成器函數,函數被調用時會返回一個生成器對象,生成器本質上還是一個迭代器,也是用在迭代操作中,因此它有和迭代器一樣的特性,唯一的區別在於實現方式上不一樣,後者更加簡潔

最簡單的生成器函數:

>>> def func(n):... yield n*2...>>> func<function func at 0x00000000029F6EB8>>>> g = func(5)>>> g<generator object func at 0x0000000002908630>>>>

func 就是一個生成器函數,調用該函數時返回對象就是生成器 g ,這個生成器對象的行為和迭代器是非常相似的,可以用在 for 循環等場景中。注意 yield 對應的值在函數被調用時不會立刻返回,而是調用next方法時(本質上 for 循環也是調用 next 方法)才返回

>>> g = func(5)>>> next(g)10>>> g = func(5)>>> for i in g:... print(i)...10

那為什麼要用生成器呢?顯然,用生成器在逼格上要比迭代器高几個等級,它沒有那麼多冗長代碼了,而且性能上一樣的高效,為什麼不用呢?來看看用生成器實現斐波那契數列有多簡單。

def fib(n): prev, curr = 0, 1 while n > 0: n -= 1 yield curr prev, curr = curr, curr + prevprint([i for i in fib(10)])#[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

生成器表達式

在前面一期「這樣寫代碼更優雅」的文章裡面曾經介紹過列表推導式(list comprehension),生成器表達式與列表推導式長的非常像,但是它倆返回的對象不一樣,前者返回生成器對象,後者返回列表對象。

>>> g = (x*2 for x in range(10))>>> type(g)<type generator>>>> l = [x*2 for x in range(10)]>>> type(l)<type list>

前面已經介紹過生成器的優勢,就是迭代海量數據時,顯然生成器更合適。

同步發表於:看完這篇,你就知道Python生成器是什麼 - FooFish

公眾號 Python之禪 (id:VTtalk),分享 Python 等技術乾貨

推薦閱讀:

Python Generator漫談
在 Pycom 使用 Python + Micropython + MQTT 進行物聯網編程
Python 字元編碼的二三事
乾貨|Scikit-Learn的五種機器學習方法使用案例(python代碼)
文獻引文分析利器 HistCite 詳細使用教程(精簡易用免安裝版本 HistCite Pro 首發頁面)

TAG:Python | Python入门 |