「雙十一」對於各銀行的科技部都有怎樣的考驗?歷年都有哪些趣事發生?
也算是一年一度的「大練兵」了...
既然好多答案都提到了宇宙行,那麼宇宙行就來現身說法吧。
【節後更新】
雙十一已經結束,宇宙行算是交了一份還算滿意的答卷。交易峰值都沒有超出預期,基本可以說是抗住了。從線上交易的峰值來看,跟支付寶基本保持一致,出現在0點過後的狂潮,部分子系統承擔著較大的壓力,但因為不屬於正常營業時間,其它渠道的交易很少,所以當天整體交易峰值並沒有出現在凌晨。從全天整體交易峰值來看,正如預期,已經接近但並非全年最高峰值。
另外一個也許被大家所忽略的事實:快捷支付交易量已經遠遠超過了傳統的B2C支付渠道,已然成為線上交易渠道的霸主。
支付寶感謝銀行,銀行也需要感謝支付寶,如此大量的真實壓測數據,遠非計算機可以模擬。系統在承受壓力的同時為金融IT界提供了相當寶貴的系統運行數據,系統的瓶頸一目了然。
感謝知乎日報的推薦,一轉眼多了這麼多知友。
其次多謝@段mefisto 的提醒,補充說下宇宙行指的是ICBC,Infinite Commercial Bank of Cosmos……苦笑下
首先回答題主的問題。對於宇宙行而言,雙十一等重大日子,是「科技線」包括三大中心而不僅僅是科技部的事情。實際上提前兩個月就開始對這個節日進行性能容量專項評估,各種預案也準備充足。提前兩周開始關注重點節點的運行情況,當天0點開始可能影響性能的操作都進行了調整,能提前的提前,能延後的延後(包括批處理等),優先確保0點高峰期的運行。一言蔽之就是各種檢查各種報告,為什麼宇宙行垮不了?就是各種準備的功勞。於是雙十一那天,大家都比較淡定。
其次說下對銀行科技系統的影響。大部分原理已經被前面的同學科普了,這裡提出另外一個角度的分析。線上支付流程,從IT 角度分析,由兩類交易組成:在線授權(我們稱之為聯機),後台清算(我們稱之為批量)。授權很好理解,客戶通過銀行跟商戶交易,銀行確認這是客戶本人做的,於是跟商戶說,這是我的客戶,東西你可以給他,我來承擔劃錢給你的責任,在這個時候,客戶被扣款了,他的交易流程就完成了。但這個時候,完整的交易並沒有完成,可以試想一下,每做一筆交易銀行就劃一筆錢,這並不是一個「經濟」的處理方案,於是清算流程就來了:作為銀行,每隔一段時間(比如一天)統一給商戶劃一筆賬,作為這段時間裡所有交易的結算。具體到雙十一,那就是跟支付寶(銀企互聯)以及他行(跨行清算)的頭寸調整工作,支付寶再調整商戶的支付寶頭寸,這就完成了整個交易過程。
從這兩種交易定義來看,我們可以清楚了解到他們的區別,授權實時性高,所見即所得。清算實時性低,可以事後慢慢來。我們所談到的銀行在雙十一「垮掉了」,說的都是授權部分,為了說明這點,我們來引入「隊列」的模型。
銀行系統對授權交易的處理,大致可以理解為排隊。交易從渠道接入層(網銀,ATM, 櫃面等等)上來,進入一個類似隊列的地方,業務處理層(具體完成交易)在前面叫號,一個個處理他們,先進的先處理,後進的後處理,也就是IT科班所說的FIFO(first in first out )。「垮了」的情況一般出現在業務處理層處理不過來的時候,進隊列的越來越多,出隊列的速度跟不上,隊列越來越長,等到最後交易超時,對於客戶來說,就是「沒反應」「失敗了」。在整個交易流程中,涉及銀行系統的很多子系統,這些子系統作為交易環節中的節點,都有可能出現這種情況,一旦出現了,就是噩夢(考核,報告,優化)的到來……
對於大多數銀行來說,其核心系統運行都是需要首先確保的。於是,在雙十一這種大潮來臨的時候,都需要有壯士斷腕的決心。分配給線上支付的資源需要設定上限,一旦達到這個限額,就要控制住渠道接入塞進隊列的數量:對不起,客滿了。嗯,是的,很多時候你是被主動拒絕的。
問題我們知道了,解決方案也逐漸清晰了:橫向擴和縱向挖。橫向擴就是加機器加CPU,業內人士都知道十八摸大型機CPU 的計價方式,於是就有了「宇宙行是用錢堆出來」的說法;縱向挖就是從應用演算法,資料庫優化,網路優化方面找答案。從這個方面來說,宇宙行的優勢就在人,幾千人的科技團隊在業內絕無僅有。對宇宙行來說,養人的成本不見得比買系統高:跟乙方不一樣,自己人需要有「需求虐我如前任我待需求如初戀」的覺悟,不行也得行造就了無數的行家……說起來都是淚。
另外補充一下,跟大神們說的不一樣,銀行IT 是使用TPS(transactions per second )描述授權交易性能的,很少有平均到分鐘的說法。去年雙十一,宇宙行的TPS 最高峰是四位數,具體數字在這裡也不方便透露。
最後忠告:雙十一請提前充值或使用宇宙行……Thanks for your kind invitation.
從銀行清算的角度來說,雙十一是最不招人喜歡的慶祝光棍節的方式。
觸類旁通的舉例,春運之前的搶票 + 春節期間的公共交通,以及長假期間的各大名勝景點,比如京郊最近的紅葉瘋了。
通過支付寶購物分成兩個階段,一是同銀行內部劃轉,二是跨行頭寸清算。阿里巴巴在各家銀行會開立支付寶專用帳戶,首先所有的同銀行買方賣方的交易總量匯總到一起,進出這個帳戶(收付款雙方均在同一家銀行,比如說工商銀行,開有銀行帳戶)。然後會在阿里巴巴公司的名義下,進行同企業跨行軋差清算,完成收付款相關方跨行開戶的問題。
其中同銀行內部清算部分,考慮到雙十一的交易量,對於任何一家銀行來說哪怕是國有四大行都是讓人頭痛不已的事情。以2013年雙十一交易量為參考,2013年雙十一成交額350.19億元,支付寶成功支付1.88億筆。考慮到收款操作都是在收貨後完成,所以只需計算這1.88億筆的交易。雙十一開始後8小時42分鐘,成交121億,粗略的等比計算一下大約等於從凌晨零點到早上八點期間發生了6496萬筆在線交易,即為每分鐘13.53萬筆交易。手頭沒有國有銀行日常的交易量數據,不過可以肯定的一點就是這種每分鐘10萬以上的交易量毫無疑問是讓現有銀行系統吃不消的(據阿里巴巴「無線支付達到 4518 萬筆,最高每分鐘支付 79 萬筆」 -____-!!)。從雙十一開始成氣候以來,每年11月11號上班銀行同行之間最感興趣的就是今天早上哪家最先崩潰,who的系統死扛到了最後。不負責任的據說,2013年的光棍節,只有宇宙第一大行的系統笑到了最後全須全尾的功成身退。
然後問題就來了,銀行要不要擴充系統去為這種一年一次的,發生概率為0.27%(1/365)的事情掏腰包搞升級?同樣的問題就是,鐵道部有沒有必要擴充系統到輕鬆應付春運的水平?各大景區要不要跑馬圈地到足夠裝下黃金周的所有遊客?然後,在一年的絕大多數時間讓擴充之後的資源閑置落灰折舊玩?我個人當然更希望上述各路神仙們可以把銀子花在更好的客戶體驗方面(ONLY IF THEY CAN...)。
曾經有人提出要通過雲計算解決這種峰值數據處理的問題,不過,銀行鐵路這種涉及國計民生的機構又有誰敢把性命攸關的數據資料交給別人呢……接著Caesar Chan,姑且以自己所知道的簡單作答:
1.性能容量評估。支付寶去年雙11的銷售額約350億,今年雙11預計銷售額預計在500億,增長達40%多,依據此預估數據,支付寶公司會給各家銀行的快捷支付渠道交易和網銀支付的TPS提出期望區間。宇宙行會依據支付寶公司給出的值結合去年的預估和實際交易TPS給出自己的預算值。該擴容就擴容。去年能撐住的一個小的原因是支付寶給出的預估值與實際偏差50%以上。
2.壓力測試。結合1的預估值至少提前兩個月進行壓力測試,壓力測試不僅僅進行一輪,需要多倫測試。壓力測試關注的指標更多,從交易發起至最終主機交易,從應用伺服器、資料庫伺服器、主機、網關、火牆、F5、網路帶寬關注各個環節的表現,避免成為瓶頸。
3.架構高可用。年初的時候支付寶和宇宙行鬧了一怔風波,宇宙行關停了多家分行與支付寶的介面,僅保留了就近一家分行作為入口,最近貌似上收了。結合今年的雙園區落成,目前是雙園區部署,交易自動分流,即使一個園區掛掉,也會在分鐘級切換,交易受影響程度小。但發生園區掛掉的概率幾乎微乎其微吧?快捷支付渠道宇宙行做為交易下游,也需要自我保護機制。通過限制交易流量的方式來保證自己不跨的情況下,保護部分人成功。
4.監控和應急。從軟硬體進行監控,針對可能出現場景指定應急預案,錯峰調節。
以上都是迎接1111的重要工作步驟,雖然都是簡單的文字描述,但這些東西都是日積月累年復一年的技術沉澱,充分準備換來的,日常都是四位數的TPS,撐住問題不大。大家放心買吧。。。不過我好像從來都沒在雙11買過東西,有推薦么?
我操刀了第一年雙十一的支付的整體工作,負責任的說除了宇宙第一大行外所有的銀行死得一塌糊塗,無一倖免。後來銀行對我們發的雙十一活動通知都很尊重了!
越拉越順暢!風雨過後,已經很彩虹。
我來自某全國排前十的股份制銀行。親身經歷過2011年的網銀錯愕(ganglou!崩潰!掉數!),2012年的有驚無險(瀉!立!停!),2013年的安然無恙(只有12點左右便秘,後來順暢),2014年系統幾乎已經無憂無慮了。上周大BOSS例會,有一個大BOSS問,那個光棍節,系統會不會有問題。IT悠悠的說,沒問題,已經跟支付寶溝通準備好了。而且今年的活動不是都集中在凌晨,一點沒問題。
讓我們拭目以待咯
作為支付寶業務和網銀業務統統託管出去的地方小商行來說,目前沒什麼壓力。
不過,好日子眼看也就結束了要。
對我們的考驗就是:如何在boss沒察覺的情況下刷一整天的淘寶…
謝邀。
我行的系統構架里,網銀交易不須經由分行,直接連總行。
總行也沒有對分行下達專門的保障指令(一般特殊時期都會有),所以雙十一對各分行來說,只是另一個普通的交易日而已。除夕前後才是真正的考驗。
不出意外的話我們應該也和大家一樣在買買買和再買砍手中度過。
經過去年半夜各種無法支付以後,大家都學乖把錢放在餘額里以便第一時間搶單支付,我覺得壓力主要還是在支付寶吧。
當然還是希望有各數據中心的同行們來回答這個問題了。歷年雙11,,,只有工行宇宙第一大行一直堅挺笑到最後~ 首先要知道工行客戶的數量。工行網銀的科技實力真的是用錢堆出來的
雙11是否構成壓力,取決於銀行系統是否能提供足夠的處理能力應對交易高峰?
據我所知,絕大部分銀行都不成問題,包括國有、股份制,有些銀行象農信銀這樣是託管的也不會有問題,一些地方性商業銀行因為系統陳舊,是有可能出現瓶頸。
支付寶還是做得比較好的,對於出現問題的銀行跟蹤比較及時,所以今年雙11應該不會出問題了。
第一年光棍節確實死的一塌糊塗,第二天科技處的處長開會整整罵了一上午,第二年開始就相當重視了,目前我已經從總行離開去了分行,毫無壓力啊哈哈哈哈
今年宇宙行交易量不大 最大的是建行 tps驚人 總體來說今年大行都太平 小行掛了幾個
前年準備不足,一過零點系統崩潰,客服被打爆,客戶流失n多。
去年提前八個月開始準備,網銀相關係統擴了兩倍容量,把主要的活動都分散時間段。雙十一最後評估下來是支付寶端的介面堵塞了,凡是進到敝行的交易都能順暢處理,而且也只是11日0時到1時前後的堵塞,接下來都沒事(但客戶投訴還是只到銀行…)
今年主要準備就是讓支付寶埠擴容。
------------------
今年交易峰值將近去年四倍,是x信的3倍略少,系統穩定度過,線路中斷次數零,交易異常零。
雙十一,第一次的時候支付寶就差一點要掛了,但哪個地方都有英雄,支付寶的魯肅同學在關鍵時刻頂上了,避免了被掛。現在輪到銀行忙了,不過還好,幾次下來都頂的不錯。。
有個叫網銀互聯的系統,平常日均會有一兩筆處理失敗,今天對完賬發現是53筆,嚇尿了
一個同學在農行數據中心 每次我付款不了打電話給他罵農行網銀的時候 他那邊背景音都跟打架了一樣
只知道一點,最大的贏家是IBM。
還知道一點,銀行科技部的職業經歷在人才市場上是要被打5折的。
股份銀行開始斂錢送iPhone6,火爆中!
非宇宙行的表示,這個交易量分攤下來不算極限吧
今年宇宙行交易量不大 最大的是建行 tps驚人 總體來說今年大行都太平 小行掛了幾個
推薦閱讀:
※雙十一這類營銷節日會觸發更多的「非理性消費」嗎,為什麼?
※小米為什麼要參加雙十一?
TAG:銀行IT | 「雙十一」購物狂歡節 |