2017年linux運維行業有哪些重要的事件?

身處linux運維行業,有哪些重要事件,有哪些可以預見的趨勢?


1. 容器技術在更多的公司落地(但是遠遠達不到樓上所說的替代運維,目前技術完全不可能)

2. 人工智慧的爆發,導致AIOPS開始被廣泛提及

3. 各種運維大會鋪天蓋地——乾貨少,廣告多

2017年,整個運維行業很浮躁。到處講自動化,講DevOps,但是能落地的少之又少。不要把任何技術神話,切實解決自身業務痛點才好,不要動不動就說替代運維、替代那個的,要落地。

真正思考如何讓運維更好做的人已經開始或者完成了轉型了。當然,運維也要思辯當前環境,做好技術轉型的準備。


前些天,在linux學習社群做了一個事件調研,希望拋磚引喻:

1.《爐石傳說》雙資料庫故障 被迫回檔——2017年1月

北京時間1月18日,由網易代理的暴雪旗下卡牌類遊戲《爐石傳說》遭遇了重大故障,從1月17日凌晨1點開始開始維護,直到1月18日下午18點才完成。而更為可怕的是,《爐石傳說》的數據並沒有恢復,備份資料庫也出現了故障,因此這款遊戲的玩家被迫回檔到1月14日15點20分。

馬哥linux運維社群小夥伴點評:

數據備份是遊戲非常重要的一件事,特別是像遊戲這樣非常重交易的產品。

2.GitLab 資料庫被誤刪 ——2017年2月

2月1日凌晨,肇事系統管理員徹夜加班工作,當他疲倦不堪地進行資料庫維護時,不慎用rm -rf命令對300GB生產環境數據執行了刪除操作,當他清醒過來按下ctrl + c來停止刪除操作時,卻只挽留了4.5G的數據,其餘所有數據消失殆盡。

丟失了 6 小時的資料庫數據(問題,合併請求,用戶,評論,片段等),據外媒報道,此次數據丟失的並非倉庫的數據,而是和倉庫相關的issue以及合併請求操作。

按照常理,GitLab應該會對這些數據進行有效備份,然而悲催的事情發生了,http://GitLab.com號稱的五重備份機制:

常規備份(24小時一次)

自動同步、LVM快照(24小時一次的)

Azure備份(支隊NFS啟用,資料庫無效)

S3備份

五大備份方法全部出現問題。所幸的是,仍有一個「也許可行」的6小時前的數據備份,可能夠搶救回來一部分數據。

馬哥linux運維社群小夥伴點評:

一遍是刪庫一邊是跑庫,不行裝個Jumpserver管理一下。

4.Docker更名Moby,也是無奈之舉——2017年04月

Docker公司直接把原Docker項目改名成了Moby,是為了將之前數年裡構建出來的龐大的粉絲團體和Google搜索內容(Google search footprint)全部轉移到Docker公司的商業產品上。

需要注意:Docker公司的商業產品包括了Docker EE和Docker CE,前者是企業收費版,後者是社區免費版。也就是說,以後大家用的(包括大家現在機器里已經安裝的)都是Docker公司的產品(注意,並不是項目),這個產品名叫Docker CE(命名方式如Docker 17.XX)。

馬哥linux運維社群小夥伴點評:

打包上市賺大錢,圈子真小啊。

5.WannaCry 勒索病毒——2017年5月

5月12日全球範圍爆發WannaCry勒索病毒,其中國內外數家機構企業波及其中。攻擊各國政府,學校,醫院等網路。我國眾多行業大規模受到感染,其中教育網受損最為嚴重,攻擊造成大量教學系統癱瘓。國內部分高校學生反映電腦被病毒攻擊,被攻擊的文檔將被加密。

自5月13日凌晨起,國內繼一些高校受到勒索病毒入侵感染之後,一些地區公安的業務系統也相繼受波及,勒索病毒已經成功入侵公安系統。這一消息確認後,國內多個地區發出因「系統維護」發布相關通知,暫停辦理交管、出入境等業務。

截止15日,該病毒造成至少150個國家受到網路攻擊,各行業深受其害。

馬哥linux運維社群小夥伴點評:

安全、漏洞、宕機,一天7*24小時服務看來是必然了。

6.Facebook 的伺服器昨天宕機了,故障持續40分鐘——2017年5月

2017年5月9日,全球最大社交網站 Facebook 一度發生故障,新加坡、馬來西亞、泰國、日本、澳大利亞等地的部分用戶無法瀏覽網站。

有用戶在嘗試登入時,網站出現錯誤訊息表示:「對不起,出現了問題。我們將儘快修復。」的提示語。Facebook 移動端 App 也有同樣的問題。

馬哥linux運維社群小夥伴點評:

看起來運維工程師不重要,宕機了就找我了吧,反正不管怎麼樣背鍋都是我。

7.股價大亂根本原因:紐約證券交易所將測試代碼部署到生產環境——2017年7月

紐約證券交易所(NYSE)在7月4日之前抓住了簡短的交易時段這個機會,以便測試與其API有關的一些代碼。

可問題是,測試代碼似乎進入到了生產環境,引起了令人意想不到的結果:一大批股票顯示的股價都一樣:123.47美元(有人在Twitter特別指出,這可能是123.456美元四捨五入後的結果)。

馬哥linux運維社群小夥伴點評:

還有這個操作,看來玩股票又有新玩法了。

8.谷歌不慎劫持BGP路由導致日本斷網約1小時——2017年8月

谷歌不慎劫持BGP路由,引發日本在8月25日周五大規模斷網約1小時。這次BGP路由劫持從當地時間下午12:22一直持續到下午1:01。BGP是一種用於連接主要互聯網服務提供商 (ISP) 網路的路由協議。該協議依賴於ISP所公布的網路中可用的IP地址。BGP路由劫持是指一個ISP錯誤地廣播並非位於本網中的IP地址段。BGP路由表通過自治系統 (AS) 號碼識別ISP。

馬哥linux運維社群小夥伴點評:

底層Bug和底層原理的了解很重要。

9.阿里巴巴捐贈給Apache社區的開源項目RocketMQ畢業——2017年9月

9月25日,Apache軟體基金會官方宣布,阿里巴巴捐贈給Apache社區的開源項目RocketMQ從Apache社區正式畢業,成為Apache頂級項目(TLP)。Apache RocketMQ是國內首個非Hadoop生態體系的頂級項目,作為阿里巴巴在開源社區努力的最新成果,在國際舞台華麗綻放,引起全球開源社區的廣泛關注和積極評價。

RocketMQ是阿里巴巴中間件技術部(Aliware)在2012年開源的第三代分散式消息中間件,以其高性能、低延時和高可靠的特性承載了近年來雙十一交易峰值(2016年為17萬筆/秒),在整個生產鏈路上都有著穩定和出色的表現。開源至今,RocketMQ已經被國內外數百家企業廣泛使用。

馬哥linux運維社群小夥伴點評:

布局軟體底層,這個是馬哥爸爸厲害之處。

10.Uber借漏洞獎勵向20歲黑客付款 掩蓋大規模數據泄露——2017年10月

11月22日,Uber發布聲明,承認2016年曾遭黑客攻擊並導致數據大規模泄露。根據這份聲明,兩名黑客通過第三方雲服務對Uber實施了攻擊,獲取了5700萬名用戶數據,包括司機的姓名和駕照號碼,用戶的姓名、郵箱和手機號。

事件一經曝光便引發了廣泛關注。11月23日有媒體稱,Uber將在歐洲面臨至少是義大利、荷蘭和英國三個國家數據保護機構的調查,甚至可能面臨英國機構高達50萬英鎊的罰款。Uber在國內也面臨多個州和聯邦政府的調查。

此前,領英、雅虎等公司也曾被曝出數據泄露事件。特別是雅虎的數據泄露,有超過10億個帳號在那次網路攻擊中受到影響,但顯然,這一次Uber事件為用戶帶來的恐慌高於之前,引發的關注度也更高。

馬哥linux運維社群小夥伴點評:

數據、穩定、安全可靠,運維這個事真是大保姆。

11.蘋果史上最弱智Bug!Mac系統無需密碼就可解鎖電腦——2017年11月

11月30日訊 周二,土耳其軟體工程師Lemi Orhan Emrin告知蘋果公司其新的MacOS系統被曝漏洞,用戶無需輸入密碼,僅輸入用戶名「root」便能進入系統。

馬哥linux運維社群小夥伴點評:

用戶許可權管理簡直要人命啊,多學學原理把。

12.美團大面積故障——2017年12月

2017年12月7日,多名網友表示,美團外賣出現訂餐故障,無法下單或無法支付。對此,美團方面今日中午回應稱,故障系技術原因導致,經緊急修復,現已陸續恢復。

  許多網友表示,中午在美團外賣點餐,雖然支付成功,訂單卻未生成。也有網友稱,下單後多次支付完成,但依舊顯示待支付。

  美團點評官方微博回應此事稱,今日午間,因技術原因導致平台部分訂單出現支付故障,用戶支付成功後顯示頁面出現延遲,經緊急修復後,現已陸續恢復,由此給用戶帶來不便,深感抱歉。

  美團方面表示,針對此次故障受到影響的訂單,已在陸續解決中,將確保故障期間用戶權益不會受到任何影響。重複支付的訂單會原路退回,系統故障期間未完成服務的訂單,用戶可以無責取消並退款。

馬哥linux運維社群小夥伴點評:

可能運維團隊的年終獎全沒了。

13.中興網信70後程序員疑因失業墜樓引發大家思考技術人員中年危機

近日,中興網信員工歐某打開26樓辦公室窗戶縱身躍下,結束了42歲的生命。目前有多種說法,有說因股份轉讓價過低和人事部產生分歧,有說疑因內部宮斗 被離職,甚至還有消息說歐有精神方面的問題。儘管具體原因仍待進一步的核實,但卻由此引髮網上一波關於中年職場危機,特別是中年程序員危機的討論。

35-45歲的中年人,學習能力下降明顯。與此同時,這是一個新技術不斷湧現的時代。一個人進入職場初期的技能、概念,過了20年後,已經完全不一樣 了。程序員這個行業,更是把這個特點發揮到極致。此外,精力明顯下降,不能熬夜,加之家務瑣事纏身,高強度工作即便有意願也很難付諸行動。如果說其他行業 的中層人員降級後仍可遊刃有餘的話,這個行業的中層降崗後,會不如自己新崗位上的同事。

馬哥linux運維社群小夥伴點評:

剛才想好努力努力,這就已經中年危機,這怎麼玩?

以上為Linux運維重要大事件的年終盤點,歡迎大家補充。


Kubernetes會逐漸替代Linux成為運維和開發的操作層。


容器化完成後運維基本失業,全員轉開發了


如果說趨勢的話,正好剛寫了篇文章應景,關於運維工作你應該知道的幾件事,希望能幫到你。


推薦閱讀:

運維工程師(網路,系統,資料庫)如何轉型雲計算架構?
想學雲計算,大學應該學什麼專業?
Dropbox 的使用體驗怎麼樣?
如何定義「雲裝逼」?

TAG:雲計算 | 互聯網 | Linux | 運維 | 2017年度盤點 |