深入理解並發/並行,阻塞/非阻塞,同步/非同步
邀請關注微信公眾號:人工智慧LeadAI(ID:atleadai)
歡迎訪問我們的官方主頁:www.leadai.org
正文共3359個字,11張圖,預計閱讀時間:9分鐘。
1、阻塞,非阻塞
首先,阻塞這個詞來自操作系統的線程/進程的狀態模型中,如下圖:
一個線程/進程經歷的5個狀態,創建,就緒,運行,阻塞,終止。各個狀態的轉換條件如上圖,其中有個阻塞狀態,就是說當線程中調用某個函數,需要IO請求,或者暫時得不到競爭資源的,操作系統會把該線程阻塞起來,避免浪費CPU資源,等到得到了資源,再變成就緒狀態,等待CPU調度運行。
定義:
阻塞調用是指調用結果返回之前,調用者會進入阻塞狀態等待。只有在得到結果之後才會返回。非阻塞調用是指在不能立刻得到結果之前,該函數不會阻塞當前線程,而會立刻返回。
阻塞調用:比如 socket 的 recv(),調用這個函數的線程如果沒有數據返回,它會一直阻塞著,也就是 recv() 後面的代碼都不會執行了,程序就停在 recv() 這裡等待,所以一般把 recv() 放在單獨的線程里調用。
非阻塞調用:比如非阻塞socket 的 send(),調用這個函數,它只是把待發送的數據複製到TCP輸出緩衝區中,就立刻返回了,線程並不會阻塞,數據有沒有發出去 send() 是不知道的,不會等待它發出去才返回的。
拓展
如果線程始終阻塞著,永遠得不到資源,於是就發生了死鎖。
比如A線程要X,Y資源才能繼續運行,B線程也要X,Y資源才能運行,但X,Y同時只能給一個線程用(即互斥條件)用的時候其他線程又不能搶奪。
A 有 X,等待 Y。
B 有 Y,等待 X。於是A,B發生了循環等待,造成死鎖。給用戶的感覺就是程序卡著不動了。
在寫代碼的時候要特別注意共享資源的使用,用信號量控制好,避免造成死鎖。死鎖的解除有個著名的銀行家演算法(https://baike.baidu.com/item/%E9%93%B6%E8%A1%8C%E5%AE%B6%E7%AE%97%E6%B3%95)
阻塞和掛起:阻塞是被動的,比如搶不到資源。掛起是主動的,線程自己調用 suspend() 把自己退出運行態了,某些時候調用 resume() 又恢復運行。
線程執行完就會被銷毀,如果不想線程被頻繁的創建,銷毀,怎麼辦?可以給線程裡面寫個死循環,或者讓線程有任務的時候執行,沒任務的時候掛起,就像iOS中的 runloop 機制一樣。線程就不會隨便的終止了。
2、同步、非同步
定義
同步:在發出一個同步調用時,在沒有得到結果之前,該調用就不返回。非同步:在發出一個非同步調用後,調用者不會立刻得到結果,該調用就返回了.
同步例子
int n = func();
next();// func() 的結果沒有返回,next() 就不會執行,直到 func() 運行完。非同步例子
func(callback);
next();...void callback(int n) // func 結果回調{ int k = n;}// func() 執行後,還沒得出結果就立即返回,然後執行 next() 了// 等到結果出來,func() 回調 callback() 通知調用者結果。同步的定義看起來跟阻塞很像,但是同步跟阻塞是兩個概念,同步調用的時候,線程不一定阻塞,調用雖然沒返回,但它還是在運行狀態中的,CPU很可能還在執行這段代碼,而阻塞的話,它就肯定不在CPU中跑這個代碼了。這就是同步和阻塞的區別。同步是肯定可以在,阻塞是肯定不在。
非同步和非阻塞的定義比較像,兩者的區別是非同步是說調用的時候結果不會馬上返回,線程可能被阻塞起來,也可能不阻塞,兩者沒關係。非阻塞是說調用的時候,線程肯定不會進入阻塞狀態。
上面兩組概念,就有4種組合。
同步阻塞調用:得不到結果不返回,線程進入阻塞態等待。
同步非阻塞調用:得不到結果不返回,線程不阻塞一直在CPU運行。
非同步阻塞調用:去到別的線程,讓別的線程阻塞起來等待結果,自己不阻塞。
非同步非阻塞調用:去到別的線程,別的線程一直在運行,直到得出結果。
3、並發,並行
先從定義說起,定義經過我通俗化了,原定義有點難理解。
並發是指一個時間段內,有幾個程序都在同一個CPU上運行,但任意一個時刻點上只有一個程序在處理機上運行。
並行是指一個時間段內,有幾個程序都在幾個CPU上運行,任意一個時刻點上,有多個程序在同時運行,並且多道程序之間互不干擾。
兩者區別如下圖:
並行是多個程序在多個CPU上同時運行,任意一個時刻可以有很多個程序同時運行,互不干擾。
並發是多個程序在一個CPU上運行,CPU在多個程序之間快速切換,微觀上不是同時運行,任意一個時刻只有一個程序在運行,但宏觀上看起來就像多個程序同時運行一樣,因為CPU切換速度非常快,時間片是64ms(每64ms切換一次,不同的操作系統有不同的時間),人類的反應速度是100ms,你還沒反應過來,CPU已經切換了好幾個程序了。
切換耗時:線程用完了時間片,釋放CPU控制權,引發系統中斷,調度程序根據相關策略選取下一個線程來運行,這裡需要一點耗時。
舉個例子吧,並行就是,多個人,有人在掃地,有人在做飯,有人在洗衣服,掃地,做飯,洗衣服都是同時進行的。
並發就是,有一個人,這個人一會兒掃地,一會兒做飯,一會兒洗衣服,他在這3件事中來回做,同一時刻只做一件事,不是同時做的,但最後3件事都可以做完。
時間片大小的選取
時間片取的小,假設是20ms,切換耗時假設是 10ms。
那麼用戶感覺不到多個程序之間會卡,響應很快,因為切換太快了,但是CPU的利用率就低了,20 / (20 + 10) = 66% 只有這麼多,33%都浪費了。時間片取的大,假設是200ms,切換耗時是 10ms
那麼用戶會覺得程序卡,響應慢,因為要200ms後才輪到我的程序運行,但是CPU利用率就高了,200 / (200 + 10) = 95% 有這麼多被利用的。所以時間片取太大或者太小都不好,一般在 10 - 100 ms 之間。
CPU調度策略
在並發運行中,CPU需要在多個程序之間來回切換,那麼如何切換就有一些策略。
3.1 先來先服務-時間片輪轉調度
這個很簡單,就是誰先來,就給誰分配時間片運行,缺點是有些緊急的任務要很久才能得到運行。
3.2 優先順序調度
每個線程有一個優先順序,CPU每次去拿優先順序高的運行,優先順序低的等等,為了避免優先順序低的等太久,每等一定時間,就給優先順序低的線程提高一個級別。
3.3 最短作業優先
把線程任務量排序,每次拿處理時間短的線程運行,就像我去銀行辦業務一樣,我的事情很快就處理完了,所以讓我插隊先辦完,後面時間長的人先等等,時間長的人就很難得到響應了。
3.4 最高響應比優先
用線程的等待時間除以服務時間,得到響應比,響應比小的優先運行。這樣不會造成某些任務一直得不到響應。
3.5 多級反饋隊列調度
有多個優先順序不同的隊列,每個隊列裡面有多個等待線程。
CPU每次從優先順序高的遍歷到低的,取隊首的線程運行,運行完了放回隊尾,優先順序越高,時間片越短,即響應越快,時間片大小就不是固定的了。
每個隊列的內部還是用先來先服務的策略。
最後發個以前寫的模擬CPU調度的程序(下載地址
https://github.com/hehe520/Data-structure-and-algorithm/tree/master/%E6%93%8D%E4%BD%9C%E7%B3%BB%E7%BB%9F%E7%9B%B8%E5%85%B3%E7%AE%97%E6%B3%95/%E8%BF%9B%E7%A8%8B%E8%B0%83%E5%BA%A6%E5%92%8C%E9%A1%B5%E9%9D%A2%E7%BD%AE%E6%8D%A2%E7%AE%97%E6%B3%95)
原文鏈接:http://www.jianshu.com/p/2116fff869b6
查閱更為簡潔方便的分類文章以及最新的課程、產品信息,請移步至全新呈現的www.leadai.org
關注人工智慧LeadAI公眾號,查看更多專業文章
http://weixin.qq.com/r/ZDnC2j-E5GKbrXu592x2 (二維碼自動識別)
大家都在看
LSTM模型在問答系統中的應用
基於TensorFlow的神經網路解決用戶流失概覽問題
最全常見演算法工程師面試題目整理(一)
最全常見演算法工程師面試題目整理(二)
TensorFlow從1到2 | 第三章 深度學習革命的開端:卷積神經網路
裝飾器 | Python高級編程
今天不如來複習下Python基礎
推薦閱讀:
※似是而非的JS - 非同步調用可以轉化為同步調用嗎?
※酷盤停止服務了, 如何看待這個問題?
※如何同步一份日程給公司所有人?
※Dropbox 好在哪裡?
※印象筆記Evernote同步失敗怎麼辦?