第1章 云原生监控概述
1.1 云原生基础架构的概念
1.1.1 云原生出现的背景
1.1.2 云原生解决了哪些问题
1.1.3 不断更新的云原生定义
1.2 云原生架构的组成
1.2.1 微服务
1.2.2 容器
1.2.3 服务网格
1.2.4 不可变基础设施与DevOps
1.2.5 声明式API
1.3 云原生应用的特征:云原生与“12因素”
1.3.1 方法论和核心思想
1.3.2 编码、部署和运维原则
1.3.3 “12因素”具体内容
1.4 云原生架构的挑战
1.5 为什么需要监控平台
1.6 SRE理念与监控的几个原则
1.7 监控的主要内容
1.7.1 黑盒监控与白盒监控
1.7.2 四个黄金指标
1.8 常见监控软件的介绍与对比
1.8.1 Cacti
1.8.2 Nagios
1.8.3 Open - falcon
1.8.4 Zabbix
1.8.5 Prometheus
1.8.6 几种监控组件的选型
第2章 Prometheus概述
2.1 Prometheus是一款什么样的组件
2.2 Prometheus的整体架构与组成
2.2.1 Prometheus server
2.2.2 Exporters
2.2.3 Alertmanager
2.2.4 Pushgateway
2.2.5 Service Discovery
2.3 Prometheus数据采集
2.4 Prometheus的适用场景
2.4.1 Prometheus的特征
2.4.2 适用场景
第3章 深入Prometheus设计
3.1 Prometheus指标
3.1.1 Prometheus的指标定义
3.1.2 Prometheus的指标分类
3.2 服务发现
3.2.1 基于Consul的服务发现
3.2.2 静态文件配置
3.3 数据处理
3.3.1 删除不需要的指标(metric)
3.3.2 修改指标(metric)中的标签(label)
3.3.3 删除标签
3.4 数据存储
3.4.1 本地存储
3.4.2 远程存储
3.5 数据查询
3.5.1 瞬时查询
3.5.2 范围查询
3.6 告警
3.7 集群
3.7.1 单集群监控方案
3.7.2 多集群场景监控方案一:联邦机制
3.7.3 多集群场景监控方案二:Thanos
第4章 Prometheus监控的配置与安装
4.1 Prometheus的安装与使用
4.1.1 服务器设置
4.1.2 Prometheus配置文件解析
4.1.3 基于二进制包的安装
……
第5章 PromQL查询实战
第6章 Alertmanager告警解析
第7章 服务发现方案与实践
第8章 Exporter的介绍与自定义
第9章 可视化Grafana集成
第10章 Pushgateway应用实践与高可用
第11章 Prometheus存储机制与原理解析
第12章 高可用Prometheus实战
第13章 全方位监控Kubernetes集群
展开