大型网站运维
顾贤杰 徐赟 颜中冠
内容简介
运维发展到现在,与最初相比发生了巨大的变化。10多年的互联网发展,让国内的运维经历了快速的变革,开始和国外接轨,甚至在部分场景有单独的演化。DevOps和SRE作为运维领域的两个演化方向,在最近几年获得了很多关注,也有很多公司进行了相关的实践。与DevOps遍地开花的情况相比,SRE在国内的发展稍显低调。《SRE:Google运维解密》一书对国内外运维领域有很大冲击。本书作者作为一直工作在一线的运维工程师,理所当然地对SRE相关理念进行了实践,本书可以说是对SRE领域阶段性的实践总结。
本书主要对传统运维和SRE进行不同对比,让大家了解运维工程师在实践SRE理念时,关注的点和具体的实践经验。本书的前半部分更多地注重SRE在实际工作中对融入开发团队、监控建设、变更管理、容量管理、异常响应、稳定性治理、事故复盘、用户体验管理等方面的实践和落地。
在对SRE的工作有了一定了解后,本书会针对重要业务保障场景进行实战讲解。本书最后部分对SRE工作中涉及的一些技术进行了概述,以便有兴趣的同学了解SRE相关的技术点。 前言
本书主要面向有一定传统运维工作经验的工程师和对运维工作有兴趣的读者,其通过对理念实践、团队合作、变更管理、事故处理等多个运维工作领域的分析和发掘,分享传统运维团队转型SRE团队的经验和实战感悟。
在2019年的某次运维会议上,我有幸和出版社编辑接触,并获邀对SRE方向进行撰稿。作为一个长期工作在一线的运维工程师,我读过《SRE:Google运维解密》这本书,也有相关的实践经验,但是从未想到会写一本关于SRE的书。一方面是因为感觉《SRE:Google运维解密》珠玉在前;另一方面是因为虽然我写过大量的技术文章,但是对写书这件事完全没有经验。出版社编辑对国内运维方向书籍的情况进行了分析,并且不断给予我鼓励,最终让我决定开始写这本书。
本书在很大意义上算是我…