【IT168 资讯】之前,IT168数据中心频道曾经发布过一篇关于数据中心红色按钮的文章【别按红色按钮!机房管理员的"死亡笔记"】,所谓的红色按钮指的就是数据中心的紧急电源关闭按钮。在和美国消防保护协会(NFPA)就数据中心紧急电源关闭(EPO)按钮经过数年的争论后,业内领先企业终于说服NFPA修改其规范,以帮助企业避免数据中心意外停机。
EPO按钮通常是一个靠近数据中心出口的大大的红色按钮,其目的是在数据中心着火期间消防员可以迅速关闭电源,但偶尔会出现意外按下该按钮的情况,或者被不怀好意的人故意按下,这种情况被Uptime协会创始人Ken Brill称为“企业心脏攻击”,一招致命。
来自AFCOM的行业领导企业和Uptime协会从2007年开始商讨这个问题的解决方案,他们和NFPA接触,研究EPO的历史,走遍美国和全国各地的NFPA规范小组成员达成共识。
数据中心顾问和前Site Uptime Network经理David Boston说:“2010年6月和NFPA成员会晤期间,是提交修改NFPA 70 Article 645-10提议反对意见的最后机会,现在正在接受标准委员会的最后审查,将会列入2011美国国家电气规范,今年年底公布,并与2011年1月发行,这样数据中心就可以对现有EPO实施改造,不用在每个主要出口都安装EPO按钮,相反,数据中心所有者可以和本地管理部门(AHJ)协商EPO按钮的位置,从而减少被意外或恶意关停的风险,也可以协商全面取消EPO按钮,但需要使用独立的一套供电系统,在一条线路发生火灾时,不会影响到其它线路的供电”。
数据中心EPO恐怖故事比比皆是
AFCOM委员会成员,Trinity Information Services数据中心设备经理Tom Roberts就曾经看到过两起误按EPO按钮引起的数据中心意外停机。Trinity 公司2003年推出了全新的数据中心,并且是专用的建筑,但在复活节那天EPO按钮被人意外按下。这起事故引发大规模混乱,因为Trinity的那个数据中心运行的是在线临床医疗应用系统,这起事故也证明了EPO按钮对数据中心的一招致命威胁,由于数据中心往往不止一个EPO按钮,因此风险非常高。
这次经历让Roberts大为光火,他决定到当地的消防部门谈谈,经过一番解释后,当地消防部门同意Roberts将EPO按钮移到旁路,除非数据中心员工明确地将供电线路切换到旁路,否则永远不会因意外按下EPO按钮二导致数据中心停机,但遗憾的是,由于当初建筑设计时的一个失误,围绕EPO的线路形成了一个环路,而Roberts全然不知,因此旁路根本就没有工作,Trinity在2008年再次遭遇黑色的EPO按下事件。
Roberts感到非常震惊,他发誓问题不解决永不退休,但Roberts说:“现在问题已经得到解决,但我还是不会退休,因为我还要赚钱养家糊口呢!”
数据中心EPO需求从何而来?
数据中心专业人士已经和EPO需求战斗了很多年,一些大公司也相继给NFPA施加压力,但都无济于事,位于巴尔的摩的数据中心设计公司TiePoint Engineering的总裁Richard Schlosser说:“要修改规范必须要让消防管理部门认识到问题的严重性”。 Schlosser在积极推动规范的修改,并研究了数据中心EPO的历史,他在马萨诸塞州布伦特里图书馆度过了一周,对NFPA规范做了认真细致的研究,并追踪了1959年以来的大型数据中心火灾案例。
下面的内容摘自阿灵顿消防杂志:
“美国空军统计机构一个电脑操作机房发生火灾,大火燃烧了近5个小时,主要燃烧物是磁带,机房未安装洒水喷头,这场大火烧焦了4000平方英尺,造成3000万建筑物和计算机设备损失”。
Schlosser说:“美国国会在这次事件后,要求NFPA出台数据中心消防管理条例,NFPA很快提出了一个全新的规范,其中包括数据中心控制台关闭开关,也就是我们今天所说的EPO按钮”。
Schlosser补充道:“要降低消防安全需求,第一反应是不容易说服管理部门,对数据中心行业而言,在大门边安装一个大大的红色按钮的确很不妥当,每个人都可以按它,但消防专家却一致认为PEO在紧急时候是一个救命按钮”。
Schlosser说:“我们现在的环境让消防人员认为需要在门口安装一个关闭开关,要说服他们放弃这个开关不是一件容易的事,这对于他们来说是一个大问题,他们认为从生命安全角度来看,取消EPO是向后退了一大步”。
在这场和管理部门的交战中,Schlosser他们决定和管理部门成为朋友,并提出了一些可行的替代解决方案。Schlosser说:“其中一种解决方案是增加24小时值班人员,并接受专业培训,定期向消防主管部门汇报情况,也确定只有他有权关闭数据中心,并制定相关规定,对进入数据中心的人进行约束。另一个解决方案是将EPO按钮从门口转移到专门的房间,消防人员可以进入这个上锁的房间关闭数据中心电源,这就和管理电梯供电的方式类似了,不至于让EPO置于公共地带,只有授权的人可以接触到它”。
如何和当地的消防管理部门沟通
虽然新的美国国家电气规范已经准备就绪,但要等到2011年才会发布印刷版本,届时还需要1-3年的时间当地政府才会采用新的规范,对大多数数据中心而言,意味着这个新规范要等到2013-2014年才会真正生效。
你能做些什么来加快这一进程呢?Roberts建议你向消防局局长请求,或向当地政府建言,促使他们在2011年就采用新的规范。
ROBERTS说:“如果你在数据中心工作,你要这些人保持良好的关系,你要了解他们的期望是什么,这些人在检查多层建筑和老设施时都很严格,如果你能在某些小处帮助到他们,他们也会帮助你,对双方都会有好处,如果能成为很好的朋友则更佳”。(《数据中心冷热通道控制消防规范及衡量指标》)