深入理解並發/並行,阻塞/非阻塞,同步/非同步

邀請關注微信公眾號:人工智慧LeadAI(ID:atleadai)

歡迎訪問我們的官方主頁:www.leadai.org

正文共3359個字,11張圖,預計閱讀時間:9分鐘。

1、阻塞,非阻塞

首先,阻塞這個詞來自操作系統的線程/進程的狀態模型中,如下圖:

進程狀態

一個線程/進程經歷的5個狀態,創建,就緒,運行,阻塞,終止。各個狀態的轉換條件如上圖,其中有個阻塞狀態,就是說當線程中調用某個函數,需要IO請求,或者暫時得不到競爭資源的,操作系統會把該線程阻塞起來,避免浪費CPU資源,等到得到了資源,再變成就緒狀態,等待CPU調度運行。

定義:

阻塞調用是指調用結果返回之前,調用者會進入阻塞狀態等待。只有在得到結果之後才會返回。

非阻塞調用是指在不能立刻得到結果之前,該函數不會阻塞當前線程,而會立刻返回。

阻塞調用:比如 socket 的 recv(),調用這個函數的線程如果沒有數據返回,它會一直阻塞著,也就是 recv() 後面的代碼都不會執行了,程序就停在 recv() 這裡等待,所以一般把 recv() 放在單獨的線程里調用。

非阻塞調用:比如非阻塞socket 的 send(),調用這個函數,它只是把待發送的數據複製到TCP輸出緩衝區中,就立刻返回了,線程並不會阻塞,數據有沒有發出去 send() 是不知道的,不會等待它發出去才返回的。

拓展

如果線程始終阻塞著,永遠得不到資源,於是就發生了死鎖。

比如A線程要X,Y資源才能繼續運行,B線程也要X,Y資源才能運行,但X,Y同時只能給一個線程用(即互斥條件)用的時候其他線程又不能搶奪。

A 有 X,等待 Y。

B 有 Y,等待 X。

於是A,B發生了循環等待,造成死鎖。給用戶的感覺就是程序卡著不動了。

在寫代碼的時候要特別注意共享資源的使用,用信號量控制好,避免造成死鎖。死鎖的解除有個著名的銀行家演算法(https://baike.baidu.com/item/%E9%93%B6%E8%A1%8C%E5%AE%B6%E7%AE%97%E6%B3%95)

阻塞和掛起:阻塞是被動的,比如搶不到資源。掛起是主動的,線程自己調用 suspend() 把自己退出運行態了,某些時候調用 resume() 又恢復運行。

線程執行完就會被銷毀,如果不想線程被頻繁的創建,銷毀,怎麼辦?可以給線程裡面寫個死循環,或者讓線程有任務的時候執行,沒任務的時候掛起,就像iOS中的 runloop 機制一樣。線程就不會隨便的終止了。

2、同步、非同步

定義

同步:在發出一個同步調用時,在沒有得到結果之前,該調用就不返回。

非同步:在發出一個非同步調用後,調用者不會立刻得到結果,該調用就返回了.

同步例子

int n = func();

next();

// func() 的結果沒有返回,next() 就不會執行,直到 func() 運行完。

非同步例子

func(callback);

next();

...

void callback(int n) // func 結果回調

{

int k = n;

}

// func() 執行後,還沒得出結果就立即返回,然後執行 next() 了

// 等到結果出來,func() 回調 callback() 通知調用者結果。

同步的定義看起來跟阻塞很像,但是同步跟阻塞是兩個概念,同步調用的時候,線程不一定阻塞,調用雖然沒返回,但它還是在運行狀態中的,CPU很可能還在執行這段代碼,而阻塞的話,它就肯定不在CPU中跑這個代碼了。這就是同步和阻塞的區別。同步是肯定可以在,阻塞是肯定不在。

非同步和非阻塞的定義比較像,兩者的區別是非同步是說調用的時候結果不會馬上返回,線程可能被阻塞起來,也可能不阻塞,兩者沒關係。非阻塞是說調用的時候,線程肯定不會進入阻塞狀態。

上面兩組概念,就有4種組合。

同步阻塞調用:得不到結果不返回,線程進入阻塞態等待。

同步非阻塞調用:得不到結果不返回,線程不阻塞一直在CPU運行。

非同步阻塞調用:去到別的線程,讓別的線程阻塞起來等待結果,自己不阻塞。

非同步非阻塞調用:去到別的線程,別的線程一直在運行,直到得出結果。

3、並發,並行

先從定義說起,定義經過我通俗化了,原定義有點難理解。

並發是指一個時間段內,有幾個程序都在同一個CPU上運行,但任意一個時刻點上只有一個程序在處理機上運行。

並行是指一個時間段內,有幾個程序都在幾個CPU上運行,任意一個時刻點上,有多個程序在同時運行,並且多道程序之間互不干擾。

兩者區別如下圖:

並行是多個程序在多個CPU上同時運行,任意一個時刻可以有很多個程序同時運行,互不干擾。

並發是多個程序在一個CPU上運行,CPU在多個程序之間快速切換,微觀上不是同時運行,任意一個時刻只有一個程序在運行,但宏觀上看起來就像多個程序同時運行一樣,因為CPU切換速度非常快,時間片是64ms(每64ms切換一次,不同的操作系統有不同的時間),人類的反應速度是100ms,你還沒反應過來,CPU已經切換了好幾個程序了。

切換耗時:線程用完了時間片,釋放CPU控制權,引發系統中斷,調度程序根據相關策略選取下一個線程來運行,這裡需要一點耗時。

舉個例子吧,並行就是,多個人,有人在掃地,有人在做飯,有人在洗衣服,掃地,做飯,洗衣服都是同時進行的。

並發就是,有一個人,這個人一會兒掃地,一會兒做飯,一會兒洗衣服,他在這3件事中來回做,同一時刻只做一件事,不是同時做的,但最後3件事都可以做完。

時間片大小的選取

時間片取的小,假設是20ms,切換耗時假設是 10ms。

那麼用戶感覺不到多個程序之間會卡,響應很快,因為切換太快了,但是CPU的利用率就低了,20 / (20 + 10) = 66% 只有這麼多,33%都浪費了。

時間片取的大,假設是200ms,切換耗時是 10ms

那麼用戶會覺得程序卡,響應慢,因為要200ms後才輪到我的程序運行,但是CPU利用率就高了,200 / (200 + 10) = 95% 有這麼多被利用的。

所以時間片取太大或者太小都不好,一般在 10 - 100 ms 之間。

CPU調度策略

在並發運行中,CPU需要在多個程序之間來回切換,那麼如何切換就有一些策略。

3.1 先來先服務-時間片輪轉調度

這個很簡單,就是誰先來,就給誰分配時間片運行,缺點是有些緊急的任務要很久才能得到運行。

3.2 優先順序調度

每個線程有一個優先順序,CPU每次去拿優先順序高的運行,優先順序低的等等,為了避免優先順序低的等太久,每等一定時間,就給優先順序低的線程提高一個級別。

3.3 最短作業優先

把線程任務量排序,每次拿處理時間短的線程運行,就像我去銀行辦業務一樣,我的事情很快就處理完了,所以讓我插隊先辦完,後面時間長的人先等等,時間長的人就很難得到響應了。

3.4 最高響應比優先

用線程的等待時間除以服務時間,得到響應比,響應比小的優先運行。這樣不會造成某些任務一直得不到響應。

3.5 多級反饋隊列調度

有多個優先順序不同的隊列,每個隊列裡面有多個等待線程。

CPU每次從優先順序高的遍歷到低的,取隊首的線程運行,運行完了放回隊尾,優先順序越高,時間片越短,即響應越快,時間片大小就不是固定的了。

每個隊列的內部還是用先來先服務的策略。

最後發個以前寫的模擬CPU調度的程序(下載地址

github.com/hehe520/Data

原文鏈接:jianshu.com/p/2116fff86

查閱更為簡潔方便的分類文章以及最新的課程、產品信息,請移步至全新呈現的www.leadai.org

關注人工智慧LeadAI公眾號,查看更多專業文章

weixin.qq.com/r/ZDnC2j- (二維碼自動識別)

大家都在看

LSTM模型在問答系統中的應用

基於TensorFlow的神經網路解決用戶流失概覽問題

最全常見演算法工程師面試題目整理(一)

最全常見演算法工程師面試題目整理(二)

TensorFlow從1到2 | 第三章 深度學習革命的開端:卷積神經網路

裝飾器 | Python高級編程

今天不如來複習下Python基礎

推薦閱讀:

似是而非的JS - 非同步調用可以轉化為同步調用嗎?
酷盤停止服務了, 如何看待這個問題?
如何同步一份日程給公司所有人?
Dropbox 好在哪裡?
印象筆記Evernote同步失敗怎麼辦?

TAG:并发 | 并行计算 | 同步 |