6.2.4. 运维管理的信息化要求
对数据中心运维管理产品的要求始于对数据中心信息系统的总体规划。这种规划无论大小、深浅都应始终坚持从数据中心的运维战略、业务需求、风险控制、成本效益等目标出发,同时还应清醒地认识到两个常见的决策误区:一是认为采用了高端的运维管理产品就代表了高质量的运维水平。对于这一认识毋庸赘言,从上述对人员、流程、合作伙伴的要求就可以看出,产品仅是一个方面而不能代表全部;另一个误区是不重视运维管理信息系统的建设,认为在信息系统建设上的投入不能带来直接的价值。对此,从专业化的数据中心运维角度来看,数据中心信息化能够实实在在带来的好处可以简单概括为以下几个方面:
(1) 提高效率、降低成本。一个运维管理产品的投入使用往往可以带来十几倍以上的生产力提升和相应的成本降低。业界的普遍看法是:运维管理信息系统其实就是数据中心业务的生产系统。
(2) 使运维风险保持在可以控制的水平。数据中心如果不重视对风险的控制就如同在高速公路上行车不系安全带一样危险,而危险一旦发生想继续行驶可就难上加难了。
(3) 改进服务质量提升竞争力。数据中心的业务可以概括为:通过运行IT系统来向客户提供服务。没有信息系统的支撑来运行IT系统就如超市里仍然采用手工结账一样不能让顾客满意。
在随后的内容中,将针对数据中心运维管理产品中处于核心地位的监控管理产品(包括:基础设施监控产品和IT监控产品)和IT服务管理产品进行更进一步的介绍,而介绍的角度主要从选择的要素与系统部署架构出发。
1. 基础设施监控管理系统
随着计算机技术的发展和普及,计算机系统数量与日俱增,其配套的环境设备也日益增多。数据中心机房已成为各大单位的重要组成部分。数据中心机房的环境设备(供配电、UPS、空调、消防、安防等)必须时时刻刻为计算机系统提供正常的运行环境。一旦数据中心机房环境设备出现故障,就会影响到计算机系统的运行,对数据传输、存储及系统运行的可靠性构成威胁,如事故严重又不能及时处理,就可能损坏IT设备,造成严重后果。
1) 基础设施监控产品的选择要素
(1) 技术先进性。
(2) 系统高可靠性:系统硬件和软件均采用技术成熟的产品。
(3) 系统运行管理方便:界面操作简单,技术支持能力强,承建单位技术实力强,服务完善。
(4) 系统可扩展性能强:模块化结构有利于扩容与扩展。
(5) 系统兼容性:支持世界厂家提供的智能设备,实现完美的监控。
(6) 投资少:系统选型具有高性价比。
(7) 建设时间短:在较短的时间内完成系统的安装调试。
2) 基础环境监控管理系统部署模式
针对基础环境监控的部署一般采用采集处理、传输数据、监控展现和管理三层模式。下面以多数据中心基础环境监控管理为例说明,如图6-12所示。
图6-12 数据中心机房基础设施监控管理
(1) 数据采集和处理:各数据中心通过对基础环境和设施的数据采集与处理在本地实现监控。
(2) 传输层:各数据中心通过传输层将采集和处理的数据传送到需要的管理中心,如果是接入到Internet网络必须通过防火墙进行网络设定。
(3) 监控展现和管理:通过传输层,将数据中心采集和处理的基础设施的监控指标进行集中管理,生成报表和报警。
2. IT系统监控管理系统
为了满足企业对IT服务要求的不断提高,不仅在可用性上,同时也要在资源利用率、可扩展性、容量管理等方面满足用户需求。数据中心应建立能对操作系统、应用系统和网络状况等进行故障监测和性能管理的监测系统。
通过此类系统,一方面可以对数据中心的服务器及其应用进行实时监测,另一方面也可以为系统管理人员提供完善的监测和报警平台以及可用性、容量管理的实时报告。最终能帮助系统管理人员快速定位并查找故障根源,有效降低由于服务器应用系统发生故障或失败而导致的风险,提高数据中心运维的服务质量,保证数据中心的服务器及其应用能7×24持续正常、稳定的运行,并根据客户需求的不同,提供5×8、7×12的分级服务。
1) IT系统监控产品的选择要素
虽然业界有许多满足此类需求的解决方案,但是如何才能找到一套符合企业运营管理特点的IT系统监控产品呢?在此,可以从以下几个方面评估产品功能,包括:
(1) 能否满足跨操作系统、远程监测管理的要求;
(2) 能否实现对服务器、网络设备、数据库、中间件、甚至应用系统的监测;
(3) 能否实现远程报警等多种报警方式;
(4) 能否提供丰富的报告、资源统计、分析等;
(5) 在进行数据采集时能否支持代理与无代理相结合的方式;
(6) 是否具备方便实用的用户管理功能;
(7) 能否提供开放的API接口;
(8) 是否能够保障监控的安全性。
2) IT系统监控管理系统部署模式
IT监控系统的部署模式一般分成被监控层、采集层、数据处理层、服务展现层、服务管理层。IT监控系统部署模式如图6-13所示。
(1) 被监控层:被IT监控系统监控的对象,如网络设备、系统资源、应用资源、数据库资源。
(2) 数据采集层:根据需求采集监控对象的资源数据,并进行规则设定。
(3) 数据处理层:根据需要对采集的数据做进一步处理、保障数据的完整性,对数据进行选择性存储。
(4) 监控服务展现层:将IT监控系统处理后的结果,展现给运维管理人员和关注IT资源的相关人员。
(5) 服务管理层:与服务管理的API接口,将展现的故障、问题,以服务管理的方式进入服务管理系统,实现由事件到服务的转换。
3. IT服务管理系统
作为一个数据中心,如何管理各项与IT运维直接相关的工作,如何让这些工作遵循一些国际非常好的实践,如何提升IT运维过程中的工作效率与知识积累能力,部署一套符合ITIL标准ITSM工具平台,并在其上建立配置管理数据库和知识库,无疑是一个相对比较成熟解决方案。通过这样的IT服务管理平台,可以帮助数据中心以“服务”的方式进行信息技术管理,很好地解决流程、人员、技术之间的关系。
1) IT服务管理产品选择原则
IT服务管理系统的建设实践证明:无论是对内还是对外提供服务,无论是单一的数据中心还是多地域分布的数据中心,选择产品时都应在遵循“集中建设、统一管理”的总体原则基础上,保证系统建设具有系统性、实用性、高效性、可扩展性,以及技术上的先进性、规范性和安全性。具体来说,所选择的产品应能满足以下建设原则要求:
(1) 应建立集中的统一服务管理平台,对流程服务质量、运行状况、工作流程等实现实时监控、集中管理。
(2) 对于为流程管理直接服务的基础信息,应采用统一规划、统一标准、统一控制的方式建设。
(3) 实用性和高效性原则。
(4) 安全性原则:应体现在拥有完善的身份认证和授权,具有数据备份、应急处理与灾难恢复等技术措施,具备完善的包含“用户、角色、对象、动作、许可证”的权限策略库。
(5) 可灵活定制原则:从技术架构、数据和应用架构方面等方面均能适应后续的定制要求。
(6) 高扩展性原则:既要满足现有和近期的性能要求,又要具备平滑扩展系统性能的能力。
(7) 易于集成原则:能够与IT监控系统、基础设施监控系统、消息通知系统、移动应用系统、集中报表系统、ERP系统、门户等进行集成。
(8) 灵活的报表技术:能提供统一化又能体现个性化的报表功能。
(9) 便于“统一规划、分步实施”:选择的产品应具有模块化逐步集成的能力。
(10) 产品厂商应具有强大的实力。
2) IT服务管理系统逻辑结构
IT服务管理系统逻辑结构如图6-14所示。
图6-14 IT服务管理系统逻辑结构
3) IT服务管理系统部署模式
IT服务管理系统的部署模式多种多样,取决于数据中心的业务发展战略和技术实现。图6-15为多数据中心IT服务管理系统部署。
图6-15 IT服务管理系统部署