一周IT博文精選TOP10(第九期)

1. SRE系列教程 | 孫宇聰:來自Google的DevOps理念及實踐(上)dockone.io/article/1820

> 本文為上篇,講述了SRE的基本概念和核心原理. 文章內容有: 什麼是SRE?; 傳統運維模式的弱點 ;Google SRE的起源與特點;SRE的工作職責; 應急響應;日常運維; 工程研發; SRE模型成功的關鍵要素(職業化, 專業化, 打通與產品團隊的反饋迴路);

2. SRE系列教程 | 孫宇聰:來自Google的DevOps理念及實踐(下)

> 本文為下篇, 介紹google的平台化建設, 容量規劃和管理,實戰演習,oncall制度, 事後總結, slo預估等

3. Ansible 超詳細使用指南 jianshu.com/p/f0cf02722

> 詳細介紹了ansible playbook配置和相關的概念

4. Apprenda發布Kubernetes自動化運維工具KET

> KET試圖對「在生產環境運行可信任Kubernetes平台的最佳實踐」進行標準化。本文介紹了它的相關特性。

5. 如何打造一個高逼格的雲運維平台? greatops.net/?

> 金融體系的運維平台建設實踐, 內容涉及痛點和願景, 雲運維產品介紹, 場景規劃, 技術方案,成果展示等

6. 分散式鎖總結 my.oschina.net/pingpang

> 介紹分散式鎖的幾個問題, 如單點問題,超時問題。

7. 日誌文件系統是怎樣工作的 linuxperf.com/?

> 深入淺出的介紹了日誌文件系統的原理

8. Docker 學習資源整理 zhuanlan.zhihu.com/p/23

> docker的中文資源,作者整理的很全

9. 運維改革探索(一):用多層級監控實現可視化運維 yunweipai.com/archives/

> 介紹中國移動監控系統的建設

10. 運維改革探索(二):構建可視化分散式運維手段 yunweipai.com/archives/

> 介紹中國移動自動化巡檢, 自動化運維操作, 自動化部署, 自動化數據管理 , 大數據實時分析的實踐

[歡迎關注我的微信公眾號hackstoic, 在移動端獲得最新的文章推送]

推薦閱讀:

基於產品思維驅動的運維服務建設
Python 項目的部署,目前互聯網公司有哪些成熟的方案?

TAG:DevOps | Kubernetes | SRESiteReliabilityEngineer |