
Prometheus云原生监控:运维与开发实战
云计算与虚拟化技术丛书
作品简介
本书主要围绕当前业界最流行的监控系统Prometheus展开,除了帮助读者快速了解Prometheus的概念、用途、环境搭建等系统性、宏观的认识,更多的让读者感受到Prometheus独孤九剑破众多技术壁垒的精彩。支持监控微服务、系统级监控、数据库监控、中间件监控、大数据监控等。第1章主要介绍监控系统的相关概念。第2章介绍Prometheus的相关概念。第3章介绍SpringBoot如何集成Prometheus的实战案例。第4章介绍Prometheus中PromQL的相关概念。第5章继续介绍PromQL的更多高级用法。第6章介绍Prometheus的告警模块Alertmanager。第7章介绍Prometheus的exporter相关概念。第8章介绍Prometheus集成SpringBoot实战场景中的高级话题。第9章介绍Prometheus的集群实战。第10章介绍Prometheus的存储原理。第11章介绍Prometheus的其他相关技术。
朱政科,资深架构师,中间件技术专家,对数据库连接池和Prometheus等监控技术有深入研究。有10余年IT行业从业经验,现就职于国内某大型世界百强企业。曾在阿里等一线互联网公司长期从事中间件的研发及团队管理工作。先后主导和参与了多个重要的与物联网、人工智能等相关的大型项目。著有《HikariCP数据库连接池实战》。
作品目录
赞誉
前言
第1章 监控之美
1.1 监控:把握应用的脉搏
1.2 监控架构分类
1.3 MDD思想:从指标到洞察力
1.4 监控系统选型分析及误区探讨
1.5 本章小结
第2章 Prometheus入门
2.1 Prometheus发展简史
2.2 Prometheus的主要特点
2.3 Prometheus架构剖析
2.4 Prometheus的3大局限性
2.5 快速安装并启动Prometheus
2.6 本章小结
第3章 Spring Boot可视化监控实战
3.1 用Micrometer仪表化JVM应用
3.2 在Spring Boot 2.x中集成Prometheus的方法
3.3 针对Spring Boot 2.x采集并可视化相关数据
3.4 第三方专业可视化工具——Grafana
3.5 Grafana高级模板
3.6 邮件告警的生成与扩展
3.7 构建钉钉告警系统
3.8 本章小结
第4章 PromQL让数据会说话
4.1 初识PromQL
4.2 PromQL中的4大选择器
4.3 Prometheus的4大指标类型
4.4 13种聚合操作
4.5 Prometheus的3种二元操作符
4.6 向量匹配
4.7 本章小结
第5章 PromQL高级实战
5.1 Prometheus内置函数
5.2 HTTP API
5.3 两种可定期执行的规则
5.4 指标的抓取与存储
5.5 通过调优解决PromQL耗尽资源问题
5.6 本章小结
第6章 Prometheus告警机制深度解析
6.1 Alertmanager架构解析
6.2 AMTool的安装与用法
6.3 配置文件的编写与解读
6.4 告警规则的定义
6.5 关于告警的高级应用与问题处理
6.6 构建高可用告警集群
6.7 本章小结
第7章 Prometheus独孤九剑:通过定制Exporter监控一切
7.1 Exporter概述
7.2 Exporter的数据规范
7.3 Exporter数据采集方式
7.4 一个最简单的Exporter示例
7.5 自己动手编写一个Exporter
7.6 高质量Exporter的编写原则与方法
7.7 Node Exporter源码解析
7.8 Exporter高级应用:开启TSL连接和Basic Auth认证
7.9 本章小结
第8章 Spring Boot高级监控实战
8.1 Controller监控实战
8.2 业务代码监控实战
8.3 通过注解进行监控的设置与实战
8.4 Dubbo监控实战
8.5 SPI机制原理解析
8.6 SPI高级实战:基于Dubbo的分布式日志链路TraceID追踪
8.7 集成Spring Boot时的常见问题及其解决方案
8.8 关于Micrometer的两个常见问题及其解决方案
8.9 micrometer-spring-legacy源码解析
8.10 本章小结
第9章 Prometheus集群实战
9.1 校时
9.2 Prometheus的3种常见HA架构方案
9.3 Prometheus集群架构采集优化方案
9.4 在企业中从零推广Prometheus架构
9.5 搭建基于M3DB的简单HA+远程存储Prometheus K8S集群
9.6 多租户、可横向扩展的Prometheus即服务——Cortex
9.7 本章小结
第10章 Prometheus存储原理与问题分析
10.1 本地存储文件结构解析
10.2 存储原理解析
10.3 存储配置方法
10.4 本地存储容量规划原则与方法
10.5 RAM容量规划原则与方法
10.6 本地存储及时性和时序性问题分析
10.7 本章小结
第11章 Prometheus其他相关技术分析与实战
11.1 Thanos架构与监控实战
11.2 M3DB技术详解
11.3 Loki的特性、架构与应用
11.4 ELK的5种主流架构及其优劣分析
11.5 Fluentd和Fluent Bit项目简介
11.6 Operator模式现状与未来展望
11.7 关于灵活运用Prometheus的几点建议
11.8 本章小结
附录A Prometheus相关端口列表
附录B PromQL速查手册
附录C Prometheus 2.x(从2.0.0到2.20.0)的重大版本变迁
附录D Prometheus自监控指标
附录E SLA服务可用性基础参考指标