搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
Ganglia系统监控
0.00    
图书来源: 浙江图书馆(由图书馆配书)
  • 配送范围:
    全国(除港澳台地区)
  • ISBN:
    9787111436744
  • 作      者:
    (美)Matt Massie[等]著
  • 出 版 社 :
    机械工业出版社
  • 出版日期:
    2013
收藏
作者简介

  Matt Massie,2000年在加利福尼亚大学伯克利分校担任研究员时开发了Ganglia。他设计的Ganglia实现了对遍布整个美国,用于科学研究的共享计算机网格集群的监控。2010年,在O扲eilly出版的由John Allspaw和Jesse Robbins编写的 Web Operations: Keeping the Data On Time一书中,他撰写了关于集群监控的一个章节。Matt现在Cloudera担任软件工程师,聚焦于Apache Hadoop企业管理与监控。

  Bernard Li,担任劳伦斯伯克利国家实验室高性能计算系统工程师,目前也是Ganglia系统的维护工程师。他从2003年开始涉及高性能计算领域并致力于很多开源项目,如OSCAR、SystemImager和Warewulf。

  Brad Nicholes,是Apache软件基金会的成员,目前在Novell担任软件工程师顾问。除了参与Apache HTTPD和APR项目,Brad也是Ganglia项目的开发者和管理员。作为Ganglia项目的开发人员,Brad开发了C/C++和Python指标模块,并将其集成至Ganglia V3.1.x。目前Ganglia系统提供的部分指标模块,最初是由他开发贡献的。Brad毕业于犹他大学(University of Utah)和杨百翰大学(Brigham Young University),拥有计算机科学学位。

  Vladimir Vuksan(Broadcom),在技术操作、系统工程和软件开发领域工作超过15年。就职于Broadcom之前,他曾在Rave Mobile Safety、Demandware和新墨西哥大学(University of New Mexico)开发高可用性解决方案和使管理和基础设施运行更容易的工具。

展开
内容介绍
  《Ganglia系统监控》由Ganglia的设计者和维护人员亲自执笔,知识性和权威性毋庸置疑。本书不但展示了如何从任意规模的集群、网格或云基础架构中收集系统指标并使其可视化,而且为如何针对20 000台主机每10秒跟踪一次CPU利用率等问题提供答案。一旦你知晓Ganglia的主要部件如何协同工作,就会明白Ganglia是解决上述问题的最佳选择。本书颇具实践性,可以帮助经验丰富的系统管理员更好地运用Ganglia 3.X。
  《Ganglia系统监控》还可以帮助你了解如何扩展基本的指标库,取回当前指标数值,查看指标的汇聚视图,观察数据时序的趋势。你也可以通过一些实际Ganglia案例了解它是如何满足监控的一些需求的。
  ■ 判断Ganglia是否适合你的工作环境。
  ■ 了解Ganglia的gmond和gmetad后台程序是如何建立一个临时指标集合的。
  ■ 根据一些有价值的提示和建议,在部署Ganglia的早期制订可扩展的计划。
  ■ 利用gweb和Ganglia的Web客户端进一步可视化数据。
  ■ 编写插件来扩展gmond的指标集。
  ■ 如何解决安装Ganglia时可能遇到的问题。
  ■ 如何将Ganglia和sFlow以及Nagios监控系统集成。
展开
精彩书评

  “O’Reilly Radar博客有口皆碑。”
  ——Wired

  “O’Reilly凭借一系列(真希望当初我也想到了)非凡想法建立了数百万美元的业务。”
  ——Business 2.0

  “O’Reilly Conference是聚集关键思想领袖的绝对典范。”
  ——CRN

  “一本O’Reilly的书就代表一个有用、有前途、需要学习的主题。”
  ——Irish Times

  “Tim是位特立独行的商人,他不光放眼于最长远、最广阔的视野并且切实地按照Yogi Berra的建议去做了:‘如果你在路上遇到岔路口,走小路(岔路)。’回顾过去Tim似乎每一次都选择了小路,而且有几次都是一闪即逝的机会,尽管大路也不错。”
  ——Linux Journal

展开
精彩书摘
  第1章
  初识Ganglia
  Dave Josephsen
  如果你是带着一个需要解决的问题来读这本书的,虽然我不知道你的问题具体是什么,但是我敢打赌,本书的作者一定曾经体会过你的痛苦。所以,如果你需要的是一个监控和指标的收集引擎,那么你就找对地方了。我们创造Ganglia的原因,和你拿起这本书的原因一样,我们都是为了解决问题。
  如果你已经看过或者已经用过一些监控工具,你会发现Ganglia非常强大。它在设计理念和操作上与你以前遇到的监控系统有所不同,它可以运行在目前流行的所有操作系统上,轻松地扩展到超大型的网络上,并且针对节点故障进行了自愈设计。实际上,Ganglia应用于传统监控系统无法处理的大型计算机网络,一般用来提供近实时监控和性能指标的数据提取功能,同时,Ganglia可以无缝集成到你正在使用的传统监控系统中。
  在本章中,我们将向你介绍Ganglia,并帮助你评估Ganglia是否适用于你的环境,因为Ganglia是面向亟待解决问题的系统工程师而设计的,因此我们将从Ganglia诞生的环境和用它解决的问题开始介绍。
  ……
展开
目录
前言

第1章 初识Ganglia
规模的问题
主机即监控系统
基于冗余的结构
Ganglia是否适合你
gmond:字节大爆炸
gmetad:整合所有信息
gweb:下一代数据分析
稍等!这并不是所有

第2章 Ganglia的安装和配置
Ganglia的安装
Ganglia的配置
安装后的工作

第3章 可扩展性
谁会关注可扩展性
gmond和Ganglia集群的可扩展性
gmetad存储规划和可扩展性

第4章 Ganglia的Web界面
Ganglia的Web 界面导航
gweb的Search选项卡
gweb的Views选项卡
gweb 的Aggregated Graphs选项卡
gweb的Compare Hosts选项卡
gweb的Events选项卡
gweb的Automatic Rotation选项卡
gweb的Mobile选项卡
自定义复合图表
其他特性
认证和授权

第5章 指标管理和扩展
gmond:指标收集代理
基本指标
扩展指标
利用模块扩展gmond
利用gmetric扩展gmond
如何在C/C++、Python和gmetric之间做出选择
XDR协议
Java和gmetric4j
真实世界:利用NVML模块进行GPU监控

第6章 Ganglia故障排查与处理
概述
有用的资源
对监控系统进行监控
常用故障排查机制及工具
在前台/调试模式下运行
常见的部署问题
典型问题及解决步骤

第7章 Ganglia与Nagios
发送Nagios数据到Ganglia
使用Nagios监控Ganglia指标
在Nagios UI中显示Ganglia数据
使用Nagios监控Ganglia

第8章 Ganglia与sFlow
架构
标准sFlow指标
Java虚拟机指标
配置gmond以接收sFlow
Host sFlow 代理
故障解决
联合其他sFlow工具使用Ganglia

第9章 Ganglia案例分析
Tagged公司
SARA
路透社财务软件
Lumicall(Android上的移动VoIP)
稍等,多少指标?监控Quantcast
工具箱中的很多工具:监控Etsy
附录A 先进的指标配置与调试
附录B Ganglia和Hadoop/HBase
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证