扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
IBM Tivoli Monitoring 提供了一个监控服务器资源的自动化环境。它可以显著降低系统管理的开销,尤其是对于大型的公司环境。通过 Tivoli Monitoring,可以发现潜在的资源瓶颈,并在影响系统之前进行处理。 Tivoli Monitoring 还可以帮助从服务器出错情况下自动恢复。
企业级应用程序如 IBM Lotus Workplace 产品家族的管理员可以从 Tivoli Monitoring 获益匪浅。可以使用 Tivoli Monitoring 监控 Lotus Workplace 服务器,在操作系统层和 WebSphere Application Server 平台层采集数据。对于新的 Lotus Workplace 站点而言,如果它刚刚安装并部署完成一种或多种 Lotus Workplace 产品,并且目前正根据环境进行优化以使可靠性和性能达到最好,这些数据可能是至关重要的。
Lotus Engineering Test (LET) 团队最近安装和配置了 Tivoli Monitoring 来监控我们的 Lotus Workplace 测试服务器。本文将和读者分享我们在这次实践中学到的经验。我首先简要介绍一下 Tiboli Monitoring 的工作原理,然后说明我们是如何安装和设置 Tivoli Monitoring 组件的。文章最后介绍了如何使用 Tivoli Monitoring Web Health Console 监控 Lotus Workplace 服务器资源,并给出了我们得到的一些样本数据。我们的目的是阐明 Tivoli Monitoring 如何用于 Lotus Workplace 产品,以及我们怎样使用它来帮助管理和维护我们自己的 Lotus Workplace 测试环境。
我们假设您是一位有经验的系统管理员,对 Lotus Workplace 和一般服务器监控工具有一定的了解。
Tivoli Monitoring 的工作原理
Tivoli Monitoring 组件包括:
关于这些和其他 Tivoli Monitoring 组件的详细信息,请访问 IBM Tivoli 信息中心。
|
安装 Tivoli Monitoring
在测试环境中,我们安装了 Tivoli Monitoring 5.1.1 和 Tivoli Monitoring for Web Infrastructure 5.1.2,在 Tivoli Framework 4.1 上运行。(我们将在以后的文章中详细介绍 Tivoli Framework。) Tivoli Monitoring 安装在 1.266 Mhz Pentium 处理器的 PIII 服务器上,磁盘空间 38 GB,操作系统 Windows 2000。Tivoli 端点在配有两个 Xeon 处理器、2.5 GB 内存和 40 GB 内部磁盘上的 IBM Blade 计算机上运行。
我们按照 产品文档中的说明安装了 Tivoli Monitoring。基本步骤如下:
|
监控和分析 Lotus Workplace 数据
Tivoli Monitoring 极大地简化了服务器监控工作。为了分析操作系统层的不同特征再也不需要学习多种不同的工具了,我们只需要一种工具就可以采集需要的统计信息,并且可以显示、分析和创建报告。
Tivoli Monitoring Web Health Console
通过 Tivoli Monitoring 监控服务器统计信息的主要界面是 Web Health Console。 Web Health Console 收集端点发送的数据并以不同的形式显示这些信息。您可以使用 Web Health Console 监控应用任何描述文档和资源模型的端点的状态和健康状况。(“Health”是由资源模型设置所定义的一个数值。)比如,图 2 中 Web Health Console 显示的是我们的 Tivoli Monitoring 系统当前监控的端点:
图 2. Web Health Console 显示的 Tivoli 端点
您可以用 Web Health Console 查看任何一个 Tivoli 端点的各种信息:
图 3. Tivoli 端点信息
Tivoli Data Warehouse
因为 Tivoli Monitoring Web Health Console 是设计用于实时监控服务器状态和健康状况的(而不是历史数据的长期分析),它维护了 24 小时之内的统计信息,24 小时后进行刷新。长期数据保存在 Tivoli Data Warehouse(数据仓库)中。这是一种基于 DB2 的数据库,可以通过兼容 SQL 的报告工具访问。在我们的环境中使用的工具是来自 Hyperion的 Brio。
比方说,我们使用 Brio 获得一台 Lotus Workplace 服务器的下列操作系统数据:
数据 | 说明 | 最大值 | 日期 |
CommittedBytes | 该内存保留字节数 | 2,740,000,000 | 07/02/04 12:00 AM |
CommittedBytes | 该内存保留字节数 | 2,200,000,000 | 07/03/04 12:00 AM |
CommittedBytes | 该内存保留字节数 | 2,080,000,000 | 07/04/04 12:00 AM |
CommittedBytes | 该内存保留字节数 | 2,169,999,872 | 07/05/04 12:00 AM |
CommittedBytes | 该内存保留字节数 | 2,489,999,872 | 07/06/04 12:00 AM |
PagesSec | 每秒钟页数 | 79 | 07/02/04 12:00 AM |
PagesSec | 每秒钟页数 | 1,769 | 07/03/04 12:00 AM |
PagesSec | 每秒钟页数 | 100 | 07/04/04 12:00 AM |
PagesSec | 每秒钟页数 | 318 | 07/05/04 12:00 AM |
PagesSec | 每秒钟页数 | 97 | 07/06/04 12:00 AM |
PagesFaultsSec | 每秒内页面出错率 | 8,777 | 07/02/04 12:00 AM |
PagesFaultsSec | 每秒内页面出错率 | 6,217 | 07/03/04 12:00 AM |
PagesFaultsSec | 每秒内页面出错率 | 2,366 | 07/04/04 12:00 AM |
PagesFaultsSec | 每秒内页面出错率 | 1,507 | 07/05/04 12:00 AM |
PagesFaultsSec | 每秒内页面出错率 | 6,337 | 07/06/04 12:00 AM |
TotalAvail | 总可用内存数 | 714,000,000 | 07/02/04 12:00 AM |
TotalAvail | 总可用内存数 | 797,000,000 | 07/03/04 12:00 AM |
TotalAvail | 总可用内存数 | 727,000,000 | 07/04/04 12:00 AM |
TotalAvail | 总可用内存数 | 737,000,000 | 07/05/04 12:00 AM |
TotalAvail | 总可用内存数 | 853,000,000 | 07/06/04 12:00 AM |
TotalCache | Cache 内存合计 | 338,000,000 | 07/02/04 12:00 AM |
TotalCache | Cache 内存合计 | 442,000,000 | 07/03/04 12:00 AM |
TotalCache | Cache 内存合计 | 459,000,000 | 07/04/04 12:00 AM |
TotalCache | Cache 内存合计 | 466,000,000 | 07/05/04 12:00 AM |
TotalCache | Cache 内存合计 | 438,000,000 | 07/06/04 12:00 AM |
如上表所示,我们在连续五天内采集了五种不同操作系统设置的数据:
然后我们就可以分析这些数据,确定是否存在需要注意的可能存在的系统瓶颈。
我们也可以使用 Brio 连续地密切监控资源。比方说,下表列出了一天中每小时采集一次所得到 CommittedBytes(该内存保留字节数)值(午饭时的一小时除外):
1,980,000,000 | 06/17/04 12:01 AM |
2,140,000,000 | 06/17/04 01:01 AM |
2,130,000,000 | 06/17/04 02:01 AM |
2,130,000,000 | 06/17/04 03:01 AM |
2,140,000,000 | 06/17/04 04:01 AM |
2,140,000,000 | 06/17/04 05:01 AM |
2,140,000,000 | 06/17/04 06:01 AM |
2,140,000,000 | 06/17/04 07:01 AM |
2,150,000,000 | 06/17/04 08:01 AM |
2,140,000,000 | 06/17/04 09:01 AM |
1,810,000,000 | 06/17/04 11:01 AM |
1,970,000,000 | 06/17/04 12:01 PM |
2,020,000,000 | 06/17/04 01:01 PM |
2,060,000,000 | 06/17/04 02:01 PM |
2,050,000,000 | 06/17/04 03:01 PM |
2,090,000,000 | 06/17/04 04:01 PM |
2,150,000,128 | 06/17/04 05:01 PM |
2,180,000,000 | 06/17/04 06:01 PM |
1,760,000,000 | 06/17/04 07:01 PM |
1,590,000,000 | 06/17/04 08:01 PM |
2,020,000,000 | 06/17/04 09:01 PM |
1,830,000,000 | 06/17/04 10:01 PM |
1,870,000,000 | 06/17/04 11:01 PM |
要知道,这仅仅是通过 Tivoli Monitoring 能够观察到的统计信息的一个很小的样本。通过帮助您监视这些以及其他许多操作系统和平台数据, Tivoli Monitoring 可以保证 Lotus Workplace 服务器尽可能稳定而有效地运作。Tivoli Monitoring 还可以帮助提高管理资源的生产率。
|
结束语
本文介绍了如何将 Tivoli Monitoring 运用到 Lotus Workplace 测试工作中。但是从很多方面来说,这都还仅仅是一个开始。在以后的文章中,我们将进一步讨论 Tivoli Web Health Console 和 Tivoli Data Warehouse。 以后的论题可能还包括结合 Tivoli Enterprise Console 来跟踪报告 Tivoli Monitoring 生成的事件。我们还将讨论 LET 团队的 Tivoli 基础设施中的其他组件,包括 Tivoli Enterprise Console and Tivoli Monitoring for Transaction Performance。我们越来越依赖这些工具,通过分享我们的经验,希望能够帮助您在 Lotus Workplace 环境扩展壮大的时候尽量避免增加管理上的开销。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。
现场直击|2021世界人工智能大会
直击5G创新地带,就在2021MWC上海
5G已至 转型当时——服务提供商如何把握转型的绝佳时机
寻找自己的Flag
华为开发者大会2020(Cloud)- 科技行者