【IT168 资讯】经过一个季度的整合与改造,现在的公司机房已经大变样了。作为北京一家商务网站的CIO,刘鑫深感公司的数据中心变的更加智能,更加稳定。"最主要的是省心,很多时候自动化管理软件可以自行解决出现的故障,再也不用像过去一样到处忙着'救火'了。"
正说着,控制台前的液晶屏幕上的监控画面出现了红字的提示。"没什么,是温度预警而已,一会儿它自己就好了。"刘鑫镇定自若的说着:"左边的显示器显示着机房的布局,那上面标注着所有机架的负载、机架中的温度情况--可以精确到单个节点。而中间的显示器显示的是机房内的供电情况以及空调状态。右边的显示器是网络环境和各监控摄像头拍摄的画面。"
"发出报警的是一套智能管理软件,它可以综合分析机房的负载、空调负荷、机房温度分布,并对可能出现的温度变化作出预测,刚才它就根据这个机柜中一个节点的温度提升做出了警报。"刘鑫非常欣慰的看着屏幕,"现在警报解除了,温度下去了,可以看到中间的屏幕上,软件自动提高了那个机架位置空调的功率,温度一下子就下来了。"
但是,以前刘鑫所管理的数据中心可没有这么容易。 "最早是人工检测,我们有一大堆的温度和湿度传感器,在屏幕上显示着很多的温度数据,一旦有高温的情况出现,就必须加大整个空调的制冷。" 忆苦思甜,刘鑫笑着回忆以前的日子,"且不说每天盯着花花绿绿的数字头晕,单说你平时要检查那些传感器的灵敏度,要去相应的位置查看高温原因--有时候可能是空调故障。我们30多个机柜,300多台服务器,每天都会出现类似的问题。这种工作量一方面繁琐,另一方面也难以应对业务的成长。"
"而且那会儿的机房空调系统是集中式机房制冷,一个机架高温,整个机房的空调都需要开足马力,功耗一下子就上去了。我们机房那会儿每年光电力开支就达到90多万元,占到运营成本的四分之一还多。"刘鑫表示,现在的空调改造成针对单独机柜的用软件动态管理的独立空调。"就像刚才,温度高了系统就自动加大单个空调的功率来降温。"
说道电费,刘鑫表示目前的数据中心如果想省钱,智能化管理是必须的。"原因很简单,你平时没那么多负载,数据中心也不能关掉,怎么省电?当然是让它没有负载的部分都进入低功耗状态,等来了高负荷任务再唤醒。而统一调配这么多服务器,对于人来说本身就是一项不可能完成的任务。直到进行了智能化改造,目前我们可以在负载低的时候保持相当于平时1/3的功耗,相当于有2/3的机器休眠了。"
除了这些软件自动化的智能控制之外,还有一些有助于管理的分析是智能化管理改造之后才具备的。刘鑫举例称,软件在监控各个节点温度的同时,还会分析其负载和正在跑的应用,之后作出统计图表,方便我们总结数据中心内负载、功耗、温度等因素之间的关系和规律。刘鑫认为,这种统计和分析非常有用:"这在以往是难以想象的,以往我们像救火队员一样的处理一个个安全隐患;现在智能管理系统让我们可以腾出手来从宏观数据上来分析整个数据中心的运行情况,从而调整管理策略。"
刘鑫表示,随着数据中心智能化改造的深入,未来甚至他人在数百公里之外的异地,而公司里数据中心出现问题,智能化程序会自动将问题概要和几个解决策略发短信告诉他,他回复一个短信即可解决。
如果说计算机是将人从繁琐的计算工作中解放出来,互联网将人从繁杂的信息收集过程中解放出来,那么智能化的数据中心就是让人彻底摆脱"救火员"的角色,真正将精力用在优化管理策略上,而不是重复的解决问题。