减少人为错误的办法
在2010年7月1日,UI公布了一套新规范以帮助提高数据中心的正常运行时间。准则中列举出了一些操作问题,包括人的因素。
名为《数据中心机房Tier标准:可持续性运作》规范阐述了数据中心管理团队的行为与风险是如何影响长期性能的。
UI副总裁Kudritzki指出,如果管理不恰当,即使是非常先进的数据中心也会出现宕机。
规范认为在管理当中有四个方面需要注意,以力争让数据中心取得最长正常运行时间。这其中包括人员,不仅仅是人手充足,人员还需要充分具备相关资格。比如说,一个高级(Tier 4)数据中心需要配备两名全天二十四小时现场值班的管理人员。
对于各方面的维护,管理部门还必须做出正确的决策,其中包括预防性维修、日常维护和与生命周期有关的维护任务。
规范中称,培训也极为重要。因为能够对突发事情做出及时反应的雇员能够帮助避免宕机。规范中推荐现场培训、在职培训、厂商培训和正规资格认证。
最后就是数据中心的整合规划、协调和管理。规范中推荐管理员制订数据中心机房规定、资金管理规定,充分利用空间、能源和冷却管理工具,力争使机房达到ITIL(信息技术基础设施库)标准。(