dcsimg

Zenoss:驯服报告噪音(和失去Nagios?)

您可以用Zenoss代替Nagios,但是有一些怪癖要处理,还有很多报告噪音需要调低。

 By 查理·舒丁
第页   |   返回第1页

我们开始了 Zenoss的第一篇文章 完全打算完全取代Nagios进行主机和服务监视。我们很高兴地报告,Zenoss实际上完全可以完成任务。这是最后的障碍,监视服务和警报的实现方式。

服务

不可能所有的都是桃花新闻,是吗?不,不是。在Zenoss中配置服务监视是令人沮丧的。并不是说很难做到,事实上,让它感到沮丧的唯一原因是因为您很想实施Nagios无法做到的各种幻想。如果您坚持直接进行ping测试并检查基本服务(例如HTTP),则Zenoss几乎可以自行配置。

如果单击“服务”类,然后向下钻取到可以搜索特定服务的位置(IPservice»特权),然后搜索类似SMTP的内容,就可以开始配置站点范围的监视。对于SMTP,默认情况下,如果将Monitor Monitor设置为True,则Zenoss将自动在运行该服务的任何服务器上开始监视该服务。 Zenoss的伟大之处在于它知道服务器上正在运行哪些服务,因此您只需启用监视即可运行。至少在某些人看来,这也不太好。假设您只关心5台SMTP服务器,但决定如上所述将其“打开”。现在,您将在所有受管服务器上收到有关SMTP服务的警报。

我们发现,真正令人烦恼的是,如果您为少数服务器启用了服务监视,但将全局默认值设置为Monitor = False,则Zenoss将忠实地删除您刚刚手动添加的服务。我们想知道“锁定”功能的作用。事实证明,如果您希望这些服务在下一次设备建模过程中始终存在,则必须“锁定”手动添加的服务,默认情况下,每六小时进行一次。

您的基本服务(例如SMTP,FTP和IMAP)可轻松配置。您可以复制Nagios的行为,而不必指定如何监视每个服务器的这些服务。您可能不想这样做,原因将在下一节有关警报的内容中进行讨论。

但是,Zenoss网站上有一些预告片ZenPack。可以这么说,ZenPack是一个包含插件的zip文件。一种特别吸引人的ZenPack HttpMonitor非常有用。 HttpMonitor将允许您监视和绘制网站加载时间和页面大小的图形。该ZenPack没有文档记录,但是Zenoss Wiki中有一个很好的社区编写文档。

最初,HttpMonitor看起来很麻烦。您必须像在真实服务器上一样添加一个全新的设备,但是将其称为网站的名称。您将禁用SNMP监控,因此听起来并不算过分。只有HttpMonitor性能监视器会查看这些网站的“设备”。我们创建了一个名为/ 服务 / HTTP的新设备类,并在其中添加了大量网站。每个站点都会自动继承/ 服务 / HTTP监视属性,该属性实质上是:“应用HttpMonitor模板并将失败严重性设置为Critical。”故障严重性标识将记录事件的级别。

现在,我们有了监视以及页面加载时间和大小的图表。由于所有网站都有其自己的设备类,因此在出现异常情况时一目了然。乍一看似乎很奇怪,那就是为网站创建“设备”,现在已经很不错了。

警示

我们听到的每个Zenoss用户都说:“警报太多!”这是真的。如前所述,如果启用对整个系统的服务监视,则每当任何服务器对该服务有问题时,您都会收到警报。在这一点上,人们通常开始创建服务器组,更改服务警报的默认严重性以及许多其他尝试来降低警报频率。

幸运的是,解决噪声问题非常容易。配置警报规则后,例如,您可以指定只关心标识为“生产”的服务器。也可以使用基于设备组和类别的不同警报约束。实际上,几乎任何服务或设备的属性都可以在发送警报之前进行评估。

例如,“仅在工作时间内警告有关Y类服务器的所有错误”的基础知识就很容易实现。更为复杂的约束条件使我们重新考虑了实现设备组的逻辑。主要是因为当前存在一个尚待解决的错误,该错误不允许多个“ groups not”语句,而且还因为Zenoss习惯了一些习惯才能设计出能够很好地表示复杂环境的结构。

与当前的错误相比,Zenoss警报配置比Nagios更容易配置。我们很遗憾地报告,一个很重要的功能在Zenoss的不存在:服务依赖性。 Zenoss实现了基于网络的依赖关系,该依赖关系对管理员是自动且透明的,但是由于某些原因,我们无法实现服务依赖关系。不是跨服务器的,甚至不在单个服务器上。如果要监视崩溃的服务器上的五项服务,您将收到六项警报,其中一则表示已关闭(ping检查),而每项失败的服务均收到一个警报。我们相信Zenoss将很快实现此功能,但没有明确的时间表。

实际上,令我们感到振奋的是,在150台服务器上实施测试Zenoss的大部分时间都用于配置Unix世界中没有其他监视系统提供的幻想。我们希望Zenoss之类的东西非常复杂,并且不可能应用于像OpenNMS这样的奇怪设置,但事实并非如此。

回想一下所有Nagios部署中投入的时间,特别是考虑编写脚本以生成主机条目所花费的时间。如果您可以替代也提供许多其他出色功能的Nagios替代品,那么肯定没有理由不这样做。小心;可以肯定的是,一旦Zenoss部署完毕,您将沉迷于调整,因此请在星期一开始对其进行测试。

本文最初于2007年12月12日发布
通过网络更新新闻获取最新消息