標籤:

Python協程,完美掌握!

Python協程,完美掌握!

前言

很久以前就聽說 Python 的 async/await 很厲害,但是直到現在都沒有用過,一直都在用多線程模型來解決各種問題。最近看到隔壁的 Go 又很火,所以決定花時間研究下 Python 協程相關的內容,終於在翻閱了一褲衩的資料之後有了一些理解。

起:一切從生成器開始

以往在 Python 開發中,如果需要進行並發編程,通常是使用多線程 / 多進程模型實現的。由於 GIL 的存在,多線程對於計算密集型的任務並不十分友好,而對於 IO 密集型任務,可以在等待 IO 的時候進行線程調度,讓出 GIL,實現『假並發』。

當然對於 IO 密集型的任務另外一種選擇就是協程,協程其實是運行在單個線程中的,避免了多線程模型中的線程上下文切換,減少了很大的開銷。為了理解協程、async/await、asyncio,我們要從最古老的生成器開始。

回顧 Python 的歷史,生成器這個概念第一次被提出的時候是在PEP 255中被提出的,當時的 Python 版本為 Python2.2。我們都知道range()函數,現在考慮一下我們來編寫一個自己的range()函數,最直接最容易想到的方法也許是這樣:

當你想創建一個很小的序列的時候,例如創建從 0 到 100 這樣的列表,似乎沒什麼問題。但是如果想創建一個從 0 到 999999999 這麼大的列表的話,就必須要創建一個完整的,長度是 999999999 的列表,這個行為非常佔用內存。於是就有了生成器,用生成器來改寫這個函數的話,會是下面這個樣子:

當函數執行遇到yield的時候,會暫停執行。這樣只需在內存中維護可以存儲一個整數的內存空間就可以了。

承:協程誕生

到這裡可能還和協程沒什麼關係,但是實際上這已經是 Python 協程的雛形了,我們來看看維基上對於協程的定義:

Coroutines are computer program components that generalize subroutines for non-preemptive multitasking, by allowing

multiple entry points for suspending and resuming execution at certain locations.

從某些角度來理解,協程其實就是一個可以暫停執行的函數,並且可以恢復繼續執行。那麼yield已經可以暫停執行了,如果在暫停後有辦法把一些 value 發回到暫停執行的函數中,那麼 Python 就有了『協程』。於是在PEP 342中,添加了 「把東西發回已經暫停的生成器中」 的方法,這個方法就是send(),並且在 Python2.5 中得到了實現。利用這個特性我們繼續改寫

range()函數:

就這樣,整個生成器的部分似乎已經進入了stable的狀態,但是在 Python3.3 中,這個情況發生了改變。在PEP 380中,為 Python3.3 添加了yield from,這個東西可以讓你從迭代器中返回任何值(這裡用的是迭代器,因為生成器也是一種迭代器),也可以讓你重構生成器,我們來看這個例子:

這個特性也可以讓生成器進行串聯,使數據在多個生成器中進行傳遞。歷史發展到這裡,協程的出現似乎已經就差一步了,或者這裡說是非同步編程更恰當。在 Python3.4 中加入了 asyncio 庫,使 Python 獲得了事件循環的特性(關於事件循環的內容這裡不再贅述)。asyncio + 生成器已經達到了非同步編程的條件,在 Python3.4 中,我們就可以這樣實現一個非同步的模型:

這裡的asyncio.coroutine裝飾器是用來標記這個函數是一個協程的,因為asyncio要求所有要用作協程的生成器必須由asyncio.coroutine裝飾。在這段代碼中,時間循環會啟動兩個countdown()協程,他們會一直執行,直到遇到了yield from asyncio.sleep(),會暫停執行,並且將一個asyncio.Future對象返回給事件循環。事件循環會監控這個asyncio.Future對象,一旦其執行完成後,將會把這個 Future 的執行結果返回給剛剛因為這個 Future 暫停的協程,並且繼續執行原協程。

從這個具體的例子出發,抽象點來看,實際上這個過程變成了:

  1. 你可以對任何asyncio.Future的對象進行yield from,將這個 Future 對象交給事件循環;
  2. 暫停執行的協程將等待這個 Future 的完成;
  3. 一旦 Future 獲取到事件循環,並執行完所有的代碼;
  4. 事件循環感知到 Future 執行完畢,原暫停的協程會通過 send() 方法獲取 Future 對象的返回值並且繼續執行;

轉:從 yield from 到 await

終於到了最激動人心的地方,在 Python3.5 中,添加了types.coroutine裝飾器以及async def和await。我們先來看一下 Python3.4 和 Python3.5 中如何定義一個協程函數:

看起來 Python3.5 中定義協程更為簡單了,但是實際上生成器和協程之間的差別變的更加明顯了。這裡先要指出兩個個注意點:

  1. await 只能用於 async def 的函數中;
  2. yield from 不能用於 async def 的函數中;

除此之外,yield from和await可以接受的對象是略有區別的,await接受的對象必須是一個awaitable對象。什麼是awaitable對象呢,就是一個實現了__await()__方法的對象,而且這個方法必須返回一個不是協程的迭代器。滿足這兩個條件,才算是一個awaitable對象,當然協程本身也是awaitable對象,因為collections.abc.Coroutine繼承了collections.abc.Awaitable。換句話說,await後面可接受的對象有兩種,分別是:協程和awaitable對象,當然協程也是awaitable對象。

在 Python3.6 中,這種特性繼續被發揚光大,現在可以在同一個函數體內使用yield和await,而且除此之外,也可以在列表推導等地方使用async for或await語法。

尾聲

到這裡整個協程的歷史已經是回顧完了,對於 Python 中的協程也有了一些理解!


推薦閱讀:

Python 開發中有哪些高級技巧?
如果每天堅持用12個小時學習一門編程語言,一年下來,編程能力會達到什麼程度?
簡單三步,用 Python 發郵件
基於docker+gunicorn部署sanic項目
Python如何從線程中返回值

TAG:Python |