数据中心 频道

数据中心数据分析软件助数据迁移整合

  【IT168 方案】企业数据的迁移工作是相当费时且造价昂贵的。但是,当一家企业正面临着需要迁移到新的存储平台或整合多个环境时,他们其实是可以通过废弃过时的老旧数据来避免某些不必要的迁移工作的。

  企业中毫无价值的数据可以很容易地占到总容量的30%-50%。现在,新的数据分析技术使得数据中心的管理人员们能够在迁移和整合之前删除那些没有商业价值的数据。数据分析是针对非结构化的用户文件的元数据分析。数据分析通过从关键元数据中进行提取,提供高效和具有成本效益的指标(通过NFS/CIFS/NDMP协议)。最后,相关的修改/访问日期、所有者、位置、尺寸大小甚至是重复的内容都可以通过自定义设置进行查询。

  此外,将数据分析软件与ActiveDirectory/LDAP进行整合,可以使得报告和分析按照用户群体和部门来归纳,区分有效与无效(已离职雇员)员工信息。

  数据分析软件与现有的分析解决方案大大不同。现有的分析解决方案只是通过存储资源管理(SRM)工具分析访问日志、网络元数据来对功能进行分析,而不是数据。数据分析能够深入文件内部,甚至如果有需要的话进行对全文资料进行分析,并提供全面的信息访问文件。管理文件时,这是唯一能够通过提供相关知识、以及分析工具和处置能力的解决方案,需要有效地进行数据迁移。

  自定义分析

  数据分析提供了灵活的过滤器、查询和动态汇总报告,为需要做出适当决定的企业数据中心提供相关知识背景。

  过滤器可以应用到特定的位置/目录、文件类型、用户等等情况。一旦这一焦点被定义了,动态的总结报告可用来提供数据分析。例如,在共享的服务器上执行人力资源数据分析,过滤器可以应用于集中在人力资源使用的目录,然后根据数据产生的年限总结生成报告。

  使用这些报告的动态功能,可以进一步筛选年限超过三年以上,且未被访问的数据,进而生成一个新的关于数据业主和文件类型的总结报告。这种方法会根据数据年限的详细信息产生一套人力资源数据分析,帮助企业掌握谁持有这些相关的数据,以及数据是什么类型的相关细节。

  这种分析是相当灵活的,可以让用户了解数据的当前状态,以及它是如何发生改变的。通过查找并管理已经失去其商业价值的数据,以了解哪些数据必须进行保存归档,数据分析所提供的工具,可以把数据的报告和处置工作做得相当的好。

  分类处理

  分类有助于从那已经失去了了其业务价值的数据中区分并找出仍具有业务或法律价值的数据。同时也可以将诸如iTunes资料库里的东西和其他浪费数据中心存储容量的个人文件都整理出来。

  需要废弃的数据:此类数据包括:三年或三年以上的离职员工且未在被访问过的数据信息。以部门的基础分析是否还有价值或应当被审查。例如,如果这些数据信息是属于企业的研发部门的,并具有潜在的研究价值,那么这些数据则可能需要针对元数据进行额外的调查报告。而如果数据信息是属于行政部门的,且已经没有长期的商业价值或合法持有的要求,这样,这些数据就可以删除了。

  老旧数据:非结构化的网络数据占到相当重要的一个部分。这些数据是企业现有员工的,但这些数据有超过三年的时间并没有被访问过了。老旧的数据并不一定意味着它们没有商业价值,但如果员工目前不使用它们,那么这些数据很可能需要被清除或作进一步的离线处理以待以后的分析。以部门或个人为基础对这些数据进行归类,以便实现长期的保留。

  冗余数据:在部门之间或者多次被员工共享的文件,会在企业网络中创造散布的副本。数据分析可以为每个文件生成一个唯一的文件签名,已决定其是否已经存在一个完全相同的副本。重复数据往往容易造成服务器的堵塞。如果数据是冗余的,并且没有被访问,其完全可以被列为可以删除之列。

0
相关文章