中小企业如何制定非常好的灾难恢复计划-数据中心专区

中小企业如何制定非常好的灾难恢复计划

作者：IT168.com 编辑：蔡松 2009-07-02 23:03 来源：IT168�

　　【IT168 资讯】在日常生活中，我们会尽量避免最糟糕的事情发生。我们为车买保险，为房子买保险、为自己的健康买保险，我们保护自己的个人隐私信息。既然如此，那么企业家及IT管理者是不是也应该以同样的方式来对待他们的网络和重要的基础设施呢?

　　据Gartner公司表示，大多数中小型企业(SMB)减少了对企业持续性和灾难恢复计划的投资。Gartner估计，只有35%的SMB持有一个综合全面的灾难恢复计划，而仅仅只有10%的SMB持有危机管理、意外状况、业务恢复和业务持续计划。

　　对于中小型企业来说，实施灾难恢复计划是至关重要的。据Gartner表示，近5年时间内，有40%的企业都经历过灾难从而影响业务。甚至，灾难的发生要比你想象的更加频繁，因为80%的应用程序宕机时间都是人为或过程故障造成的，而不是灾难或技术故障造成的。

　　确定宕机时间临界点

　　在制定一个灾难恢复计划时，首要目标应该是决定恢复点目标(RPO)和恢复时间目标(RTO)。RPO表示能够容忍的数据丢失量，而RTO表示应用程序可以承受的宕机时间长短，也即最大可容忍停顿(MTO)。

　　如果灾难发生，企业能够承受多长时间的业务失效呢?一个小时?一天?一周?那些提出即时恢复要求的组织需要为灾难恢复计划投入更多的资金预算，而那些可以承受长达几天的宕机时间的企业在这方面的资金投入相对要低。同样，RPO越小，价格越高，但是中小型企业必须要权衡预防性支出和重要数据丢失所带来的潜在的过高成本之间的大小。确定RPO和RTO能够帮助你合理配置资源。

　　如果企业在确定RPO和RTO方面存在困难，业务影响分析(BIA)会有所帮助。BIA的基本思路是：组织的每一个要素都依赖其它要素的持续操作，但是某些要素要比其它要素更关键。BIA对关键任务数据和系统进行优先顺序排列，并且在重大灾难事件发生时，帮助组织合理分配每一部分的资源。BIA还会告诉IT经理和中小型企业家们，如果不实施灾难恢复计划，他们将会损失多少资金

　　制定灾难恢复计划

　　当确定RPO和RTO时，你应该做好制定灾难恢复计划的准备。在你制定计划时，要牢记以下这些非常好的做法：

　　● 要囊括组织的所有利益相关者，而不仅仅只是IT部门。例如，人力资源部门在灾难恢复计划员工培训和计划沟通方面发挥着重要的作用，因此，他们也应该加入到这个计划中。首席执行者及其它高层管理者在确保灾难恢复资金和组织采购方面是不可或缺的。如果你要租用场所，财务经理应该了解你的计划。此外，将计划告诉当地的法律执行部门可能会更好。将所有利益相关者都融入到计划和实施中来是至关重要的。

　　● 防止数据筒仓。虽然将文件保存到桌面可能会更加方便，但是对于员工来说，这是一个不好的习惯。IT通常不会对每台计算机硬盘进行备份，因此采用集中服务器来防止麻烦的事情发生，并且对所有员工进行培训，使他们独立使用集中服务器。

　　● 对备份进行优先顺序排列。决定什么数据需要保存，要保存多久，并且制定一个存储策略来对关键数据和应用进行优先顺序排列，要首先对最重要的数据进行备份。

　　● 本地和异地备份：目前存在很多可用的备份技术，从在线备份服务到基于磁带和磁盘的解决方案。不管你选择哪种方法，同时进行本地和异地备份都是不可或缺的，这样，一旦重要业务场所出现故障。你的数据和应用程序也不至于遭殃。例如，使用磁盘镜像，至少2个磁盘驱动器在同时复制和存储数据，因此，如果其中一个驱动器发生故障，系统可以切换到另一个驱动器上，不管这个驱动器是位于同一个数据中心还是位于另一个国家，但是至少数据或服务没有丢失。

　　● 确保远程访问：数据保留和网络访问同样重要。如果灾难发生的时候，物理办公设备不能用，员工还需要访问网络基础设施来保持操作的可用性。所有关键人员都应该具备远程访问能力，即便仅仅只是访问公司的某一部分。

　　一旦确定宕机时间临界点，并合理地部署好灾难恢复计划，接下来就应该进行阶段性的测试。测试就是时间和金钱，因此一个组织的测试频率取决于预算。作为一种基准，中小型企业至少应该每年测试两次。如果不可能每年对整个系统进行两次以上的测试，组织应该阶段性的对最重要的应用程序和系统进行测试。进一步，测试应该在业务繁忙的时候进行，而且应该在毫无察觉的情况下进行，只允许让少部分人事先知道，从而能够真实的模拟一个真实灾难的紧急情况。最后，IT经理们应该在每次测试之后回顾整个测试过程，从而确定什么发挥了作用以及什么没有发挥作用，这样，所有的错误才能得到修正。

　　有效的灾难恢复计划对企业的生存至关重要。据McGladrey和Pullen会计师事务所表示，每年，每500个数据中心中有一个数据中心会经历一次灾难，其中有43%的数据中心无法恢复。另有29%的数据中心会在两年内被迫关闭。灾难恢复就是企业的保险，离开它，你无法生存。

关注我们