【IT168 专稿】“我活了80多岁了,从没见过这么大的洪水!”6月13日,80多岁的麦老汉在深圳光明新区被冲锋舟从洪水中解救出来后,感慨地说。受西南暖湿气流和低槽影响,广东全省64个市县发布了暴雨预警信号,其中深圳、惠州、东莞等8个县市先后发布了暴雨红色预警信号。暴雨引发塌墙、滑坡等事故,甚至导致伤亡和失踪事件。
狂风暴雨来临之时,不仅人们的财产生命安全受到威胁,IT和数据安全也遭遇前所未有的挑战。在深圳百年一遇特大台风暴雨中,GDS万国数据深圳数据中心紧急启动了台风暴雨应急预案和红色暴雨应急预案,使数据中心安然度过这一难关。
应急预案对抗风雨
万国数据深圳数据中心位于深圳观澜地区,旁边是一个安宁美丽的高尔夫球场,在这个稍有起伏的丘陵地带,深圳数据中心占地7000平方米,机房占地2000平方米,超过国际A级机房标准建设,符合国家五级灾备中心的建设要求,可以提供从灾难备份、数据中心外包等各种服务。观澜地区算得上此次暴雨的重灾区之一,但数据中心依然平稳运行,宁静如往。
“台风暴雨应急预案和红色暴雨应急预案是两个不同的预案。”万国数据副总裁于健告诉记者。在深圳数据中心有一整套完备的大预案机制,台风暴雨应急预案和红色暴雨应急预案是其中的两个组成部分。
只要有台风暴雨发生,深圳数据中心就会启动台风暴雨应急预案,这是一项针对数据中心内部的预案,一旦启动,所有相关人员检查排水、应急工具、供油、强弱电等设施,巡检频率提高到每两小时一次,并形成巡检报告。
同时,在深圳数据中心安排了7乘24小时的值班人员,他们负责监测公共媒体发布的天气预报信息。据了解,6月13日早晨8点30分,后勤部值班人员观测到异常的天气情况,拨打121天气查询热线,并登陆气象局官方网站咨询天气情况,根据深圳市气象局发布的黄色暴雨预警信号信息,将情况反馈到中心管理层,申请启动了数据中心台风暴雨应急预案。
半小时后,气象局发布红色暴雨预警信息,后勤部便立即启动了红色暴雨应急预案,并在第一时间内向全体员工以邮件和电话的形式发布了相关信息,将暴雨应急巡检的记录表格发放到应急巡检的人员手中,各部门开展暴雨应急工作。
暴风雨对深圳数据中心毫发无伤的原因也来自于正确安全的选址。“数据中心所在位置的地势要稍高一些,海拔高度要达到一定高度,另外还要看四周地势,周围有没有大河也要考虑在内,比周围地势高上两三米是必要的。”于健说。
灾备缘何很远?
虽然一些关系国家命脉的金融、电力等重要行业已经开始,但为数据中心或IT部门制定应急预案或做灾难备份的国内企业总体还不太多,在于健看来,主要原因有这样几个:①意识不够,企业上下对灾难的意识不够,觉得那是离自己很遥远的事情;②企业管理层意识不到位,不够重视。因为市场竞争激烈,企业将更多关注点放在销售或行业拓展方面,还没有将重视力度转移到灾难备份上来;③最后且最实际的原因在于企业为灾难备份和应急预案投入的人才物力比较低。
从企业主管角度来看,对灾难备份不够重视存在误区,因为如果企业面临上市或成长需求就一定要重视这个问题,企业上市路演时,策略投资人已经将灾备当成一个重要的考量因素,虽然灾备是IT的事情,但可能发生的灾难带给企业的影响还包括股价等,投资人关心的问题,企业为何要轻视呢?
灾难备份已经不仅仅是数据维护的问题,如果数据中心一旦发生风险,数据损失的话,影响的将是业务连续,而企业的业务一旦发生影响,损失可能无法提前估量。
灾备应急如何做?
据报道,位于美国德克萨斯州的一家数据中心前些天夜里因电力短路引发爆炸并发生火灾,导致机房所有通信暂时中断,并让7500个客户的9000台服务器停摆,预计修复的时间最快大约需要24小时。
这样的事件虽然概率很低,但如果不进行灾难备份、没有应急预案的支持恢复,企业的业务连续性就会处于危险之中。这给企业敲响警钟:将业务连续和灾难备份放在战略高度已经成为迫在眉睫的大事。
当企业开始考虑制定灾难备份和应急预案时,于健给出如下建议:
①灾备中心选址是一个重要问题,企业需要考虑十几个方面,应尽量参照国际国内标准,电力、防水、防雷等各方面都要考虑到。
②因为所有灾害不能穷举,企业首先要做一个整体预案,这个整体预案要包括目标、职责、组织架构、相应角色、决策机制、启动预案的基础条件等各方面内容,预案中一定要定义沟通、汇报、指挥、协调等各方面机制。
③企业要分析灾备中心所在地点可能面临的所有风险,然后根据不同情况制定相应预案,进行预先准备和安排。虽然在规划的时候已经把风险考虑在应急预案之中,但每次灾害可能来临之前,企业也要尽可能做好准备。
④灾难没有发生的时候,企业要做的就是不断进行演练。就像汶川地震中最“牛”的校长——安县桑枣中学校长叶志平一样,每周二强制对老师和学生进行安全教育和演习,规定之细甚至不允许学生拖着椅子,以免绊倒人出现踩踏事故。地震那天,校长其实并不在学校,但学生们就是按照平时他们已经练熟了的方式紧张有序地冲出了教师,2200多名学生、上百名教师,只用时1分36秒,结果无一人伤亡。
“相信他们第一演练向操场跑的时候,一分钟肯定没跑到操场。”于健感慨地说,“正是因为不断地练习,才使得2000多人避免了这次灾难。企业的灾备演练也应该如此,让预案称为一个个活的可以依赖的预案”。汶川地震中最牛的校长就是一分钟之内让学生全体跑到操场,就是因为提前做过演练,相信他们第一次跑的时候一分钟跑不到操场,不断练习,知道所有人都知道怎么做。
⑤灾难过后,企业还要进行不断的总结和完善,以更好地应对下一次潜在的危机。
“建设容易维护难,定期演练和严格的管理和执行是灾备应急预案最重要的事,任何灾难都很难提前通知,从制定预案到下发文件都不难,难就难在于所有员工都真正有效地重视、掌握和执行。”于健说。