Web開發中,什麼級別才算是高並發
來自專欄 寫過的代碼,忘不掉的bug
這並不是一個回答的問題的文章,而是由此引發的一個思考。
**大家心裡仔細想想,當你們聽到高並髮網站時,心裡對這個網站是個什麼概念?首先想到的是淘寶嗎?帶著問題,我們一起思考技術**
寫這個話題是因為我對搜索引擎給我的答案很不滿意,然後決定把思考的一些東西分享出來,希望可以大家彼此討論下。
我們經常在面試的時候,被問到有沒有高並發的經驗?先不說哪些考高並發的裝逼公司。我思考的是什麼才算是高並發?你一天幾個pv肯定高不了。首先在網上查找一下,並未找到明確的標準定義。那麼什麼是並發呢?
> 並發,在操作系統中,是指一個時間段中有幾個程序都處於已啟動運行到運行完畢之間,且這幾個程序都是在同一個處理機上運行,但任一個時刻點上只有一個程序在處理機上運行。
*摘自百度百科*
# 我們說的高並發是什麼?
上面的定義明顯不是我們通常所言的並發,在互聯網時代,所講的並發、高並發,通常是指並發訪問。也就是在某個時間點,有多少個訪問同時到來。
我看到有人給高並發下了類似的定義:
> 高並發通常是指我們提供的系統服務能夠同時並行處理很多請求。
來看看這個定義,這裡首先把並發給混淆到並行了。關於[並發並行的區別看這裡](還在疑惑並發和並行? - laike9ms blog),我就不多說,繼續探討並發。
然後定義又說很多請求?什麼叫很多請求?做為中國人,這個詞讓我想像力一發不可收拾......好了,拉回來,繼續本文。
那麼從上面的分析,可以看出來高並發在網路上業界也沒有明確的定義。但根據我搜索情況,一般都是pv在千萬級別以上的公司才會涉及到這個概念。所以我得出一個自定義概念:如果某個系統的日pv在千萬級別以上,他就可能是一個高並發的系統。
為什麼說是可能?那是因為有的公司完全不走技術路線,全靠機器堆,這不在我們的討論範圍。
# 高並發的問題,我們具體該關心什麼?
講真話,高並發是個比較抽象的概念。很難有一個統一的可衡量的標準。哪么有一些其它維度的標準指標來衡量系統的性能嗎?搬出以前計算機課程裡邊的一些指標來跟大家聊聊。
先聲明幾個概念,別打瞌睡。
* QPS(TPS):每秒鐘 request/事務 數量,在互聯網領域,指每秒響應請求數(指http請求);
* 吞吐量:單位時間內處理的請求數量(通常由QPS與並發數決定);
* 響應時間:系統對一個請求做出響應的平均時間。例如系統處理一個HTTP請求需要200ms,這個200ms就是系統的響應時間(我認為這裡應該僅包含處理時間,網路傳輸時間忽略)。
**這裡一定要注意呃,QPS ≠ 並發數**
並發是指,某個時刻有多少個訪問同時到來。QPS是指秒鐘響應的請求數量。那麼這裡就肯容易推算出一個公式:
QPS = 並發數 / 平均響應時間
後面我們的分析都是圍繞這個公示來進行展開,沒明白的再回味一下。
現在我們來假設一個場景:既然QPS是每秒鐘處理的http請求數量。那麼1s = 1000ms。假設我們當前一個http請求伺服器處理完成需要100ms(即那麼 **平均響應時間 = 100ms **)。那麼它1s鍾可以處理10個請求。也就是說 **qps = 10**。推算出 **並發數 = 10**
常常我們被問到高並發的問題,其實從某種程度上來說是怎麼提高現有程序的性能。現在我們基於上面的假設,來進行分析。假設現在有個系統性能上就是我們上面的假設,它每天有 300萬pv,運行在單機上(當然經常宕機),按照上面的系統性能數據,給出優化解決方案。
# 提高並發能力
通過上面的分析,要提升並發能力,我們就需要提升我們的qps(*其實這裡並不完全正確,為了說明問題,我們先放棄一部分正確性*)
最快速解決方案,就是增加機器。我們根據以上情況來實際計算一下。
* 訪問量:200w pv
* QPS:10
根據日常經驗,80% 的訪問量集中在 20%的時間,算一下這 200w pv實際需要機器達到多少qps才能滿足。
```math
qps = (200w * 0.8) / (24 * 3600 * 0.3)
qps = 61.7
```
實際上如果在單機上,要求我們每秒鐘處理請求必須達到 61.7 以上才行,而實際上我們當前系統的qps是 `10`。那麼怎麼解決?
**方案一:上機器**
個人的能力是有限的,團隊的力量是無窮的。既然一台機器搞不定,我們就多上幾台機器。這就涉及到db主從、讀寫分離、負載均衡等技術。
它的原理就是分流,把以前集中的壓力分散開來。改方案見效快,靈活,實踐起來也更快。
**方案二:增加單機性能**
單機到底性能能夠增加到一個什麼程度,這取決於你的機器配置,也取決於你的服務到底有多複雜。
> ps: 寫到這裡突然有點能夠理解為什網上對高並發都是講很多請求,沒有具體數據了,因為這真的只能針對業務來講,100個並發對靜態網頁來說根本沒有的事兒,但是對於某些密集計算型的估計...
那麼常見的單機如何提升性能?比如:增加不常變化數據的緩存,開啟php的opcache,優化代碼(如:n+1問題、多重嵌套循環、深層遞歸等),db表優化等等。由於這些每一個點拿出來都夠寫一本書了。咋就不繼續下去。
# 總結
由於筆者自己也是沒有實際經歷過kw級別pv場景,很多東西講的不一定對,本文也是理清自己的一點思路。希望能夠與更多朋友進行討論。
也希望本文能夠解決你的一點疑惑,讓我們能夠從高大上的概念落實到實際問題中去。
# 參考資料
- [並發和並行的區別](還在疑惑並發和並行? - laike9ms blog)
- [系統性能測試想個概念](系統吞吐量(TPS)、用戶並發量、性能測試概念和公式)
-----
如果你對我的內容感興趣,請關注我的微信公眾號:
公眾號:`icanfo`
![image](http://ol59nqr1i.bkt.clouddn.com/mp-qr.jpg)
GitHub:helei112g (大愚)
**我在github開源了支付寶支付、微信支付、招商一網通支付的php sdk。希望能夠幫助你提升項目開發的效率。[項目地址](helei112g/payment)**
推薦閱讀: