数据中心 频道

探讨:重复数据删除设备的数据保留问题

  重复数据删除显然很好的回答了磁盘到磁盘备份的挑战。成千上万的公司已经在他们的环境中实施了某种形式的重复数据删除,并且对此也很满意。重复数据删除可以有效的减少数据,使公司能够在一个相对较小的磁盘脚本上保存备份数据的多个副本。这些副本支持磁盘恢复,随着更多的全备份发送到系统,减少的百分比也越来越多。一个重复数据删除系统通常是一个设备或有目的建立的存储阵列,他们真正的扩充了磁带库。它能提供几周或几个月的在线备份副本,但时间不会更长。

  但是在大多数存储要求成为过去式的时候,这些旧的备份应该怎么处理呢?是存储他们呢(毕竟他们是备份软件的数据格式)还是删除冗余文件,把这些数据迁移到一个正式的归档中,或者是删除他们,还是继续把他们放在那里呢?

  对于大多数企业的回答是继续保留他们,并使用备份系统管理一个归档。虽然重复数据删除使之有吸引力,但长期使用备份系统存储数据有其自身的脆弱性:数据安全,数据检索和数据销毁。

  真正需要的是一个以归档为中心的存储系统,像那些来自Permabit公司的既可以压缩也可以重复数据删除数据,而且提供长期数据保存能力。被备份和重复数据删除的数据并不提供数据加密,它不是没被改变的固定保证数据,对于文件或email的存储不能轻易检索,当需要销毁时也不适用。

  加密

  数据必须是安全的,这意味着不管是来自有意或无意的访问都需要受保护。但是重复数据删除删除的数据不是加密的,除非存储平台特别的整合它,因为单独的加密使数据具有唯一性,惟一的数据没有重复数据移动。因此,永久的备份不会被加密。

  锁定

  除了提供防止意外的删除或破坏外,还有其他要考虑的地方。由于管理和法规遵从要求,IT管理者现在不得不使数据适用于法律发现。这就意味着它必须按需求生产来支持法律行动。但是在使用的数据支持行动之前(即监管链),法律也要求保证这个数据是不变的。证明监管链的惟一方法是把数据移到一个WORM卷。不幸的是,大多数重复数据删除备份系统也不提供WORM功能。

  检索

  如上所述,数据存储的新要求之一是针对法律发现议案能够产生特定的数据。存储系统必须能够在规定的时间检索任何有问题的文件,否则将面临被罚款或处罚。此外,历史数据必须也适用于业务需要,如趋势分析和客户预测程序来优化用户活动回报。同样,在归档后,前一个项目可能会重新启动或研究。关键在于,如果数据足够具有保存在第一位的价值,它需要可以很容易且随时可以访问,而不是备份应用程序的专有格式,这些可能在接下来的几年里改变。

  由于备份系统的目标是提高备份和备份系统的高效性,部署重复数据删除和整个备份工作——通常是数以百万计的文件——必须重建所需的文件。这和终端用户访问一个共享文件,只复制所需的文件是不同的。从一个管理员的角度看,使用备份系统长期存储的结果是花费了多余的时间来检索需要的文件,多余的时间恢复这些文件,以及其他活动所带来的失败。

  电子邮件

  对于现在的企业,电子邮件系统是一种事实上的备案制度。当一些数据的来源不确定时,你可以按照其顺序查找。一些人甚至使用电子邮件存储附件,也不会影响文件复制或共享。当考虑使用备份系统和重复数据删除的缺点时,长期存储电子邮件的访问和检索成为更重要的一个问题。

  备份系统把电子邮件系统(例如Exchange)当作一个大型数据库。他们作为一个独立的记录存储信息,通常指向该文件的附件存在。它们就像一个数据库备份和存储。为了为这些粒状存储准备数据,信息级别的存储要求一个特别的模式,包含做一个很慢的备份程序。

  优化数据的使用,减少备份周期的方法是使用电子邮件归档解决方案。多数可以通过配置发送信息和附件,如果实施了Permabit Enterprise Archive或相似的归档层解决方案,电子邮件归档也能成为一个目标。归档然后成为了所有保留信息的仓库,这样做不仅提高了效率而且也管理了数据存储。

  销毁

  使用一个备份系统管理归档提出了另一个独特的问题。管理数据更多情况是为了法规遵从,它也意味着能够访问文件和所有的复制,因此他们能够在合适的时间被销毁。知道需要被销毁的文件的真正的没有了,所有的副本也没有是非常重要的。

  运行重复数据删除的备份系统有很多备份的副本。这些文件可能物理上只存在一个地点,随着文件第一次被保存下来,他们仍然跨很多备份任务虚拟的扩展。重复的冗余文件,保存虚拟副本使重复数据删除的数据减少率保持在第一位。因此,为了确保所有的副本是销毁的,在文件被删除之前,必须要发现包含那些文件的每个备份。

  长期存储使用备份架构的另一个问题是独立。由于备份任务是写在一起的,删除的文件必须和整体的备份任务是独立的。这就意味着一个存储任务必须完成,任务也必须重新保存,保留剩下的文件。这样使进程更加复杂化。

  总结

  备份软件设计之出是备份数据,其次是存储数据。备份是用来承担数据的访问,变化,并不是用于长期管理这些数据。当重复数据删除用在长期保存数据的备份系统上,它就带来了其他的漏洞。

  在数据即将被删除之前,它就应该从备份系统中移除。对于不再属于活动备份周期的数据,更好的地方是专门建立的一个归档系统,这个系统使用软件通过一些技术和应用长期管理这些数据。这些系统可以提供三种长期存储需要:数据安全,数据获取和数据销毁。

0
相关文章