专家博客:电子发现数据管理的荆棘之路

来源:ZDNet   
2011/2/9 14:22:01
电子发现过程似乎随着诉讼的开始而产生。但事实上一个成功的电子发现过程要依赖于良好数据管理的坚实基础,这也是为什么信息管理实际上是典型诉讼电子发现工作流程的第一阶段。

本文关键字: 数据管理

电子发现过程似乎随着诉讼的开始而产生。但事实上一个成功的电子发现过程要依赖于良好数据管理的坚实基础,这也是为什么信息管理实际上是典型诉讼电子发现工作流程的第一阶段。然而一些法律和IT专业人士却忽视了这个基础:在法律上,律师对企业存储架构了解有限,对于IT人员来讲,他们不了解完善的数据管理对于电子发现过程的意义。

诉讼电子发现和企业治理、风险管理和合规审查(GRC) 需要快速、准确、具有防御能力来响应电子数据的要求。然而,企业数据传统上都位于数据孤岛,迫使电子发现过程变得不确定和难以操纵。这样糟糕的电子发现最终只能进行缓慢、有局限性和高成本的数据收集,影响密集的早期分析和文档审查过程所需的时间。这对于那些面临着需要快速响应电子发现请求的企业来说绝不是一个好消息。

电子发现数据管理的荆棘之路

这里的数据指的不是新创建的生产数据,而是旧的数据。新创建的动态数据很少成为电子发现立即考虑的对象。人力资源或法律部门可能了解当前需要数据保存的情况,但大多数电子发现请求都要求将旧的数据进行归档或备份。

数据是非结构性的,由数百个不同的应用产生并被保存在不同的位置。电子发现请求中可能包含结构性数据,而数据库的结构会使数据收集变得更加简单。非结构性数据缺乏查询结构,并对顺利和及时地收集数据带来了极为严重的障碍。非结构性数据的类型包括电子邮件应用、文件系统、SharePoint和企业内容管理(ECM)应用程序等,所有这一切都来自不同的厂商。常见的存储选择包括SANNAS、云和基于服务器的存储以及用户的硬盘和便携式硬盘。然而,这些不同的存储位置对诉讼、合规性、风险和记录管理的搜索和恢复来说都代表了一个数据类别的集合。

相比备份或应用服务器来说,归档是更好的收集源,但很多公司并不做归档。备份和归档是不同的,尽管很多公司以归档方式来备份。备份是为保持当前业务的连续性,而不是为复制的数据保持多年的价值。为相关数据搜索备份目录、恢复和审查是相当低效的——更何况一些公司还有可能无法获取旧的备份。此外,一些公司将其应用服务器存储当作归档,简单地把大量的应用数据聚集在生产服务器上。与此相反,归档就是为可供搜索、保持数据的安全性及可用性而设计的。

搜索归档数据仍旧是困难的。归档是一个很大的进步,但很多公司仍然没有这样做。而做归档的公司又很少进行集中化归档,仅仅是针对电子邮件等少数关键应用的。他们想当然的认为电子邮件是首要的电子发现数据目标,对其归档是一个不错的计划,但文件系统和应用程序,例如SharePoint,也是存储相关的信息,并应该有一种方法有效地从这些源收集数据。否则所有这些不同的应用、服务器、存储设备以及数据类型给业务连续性和流程的定位和信息恢复带来了重大挑战。

数据保存。首先,定位和收集相关数据是困难的,对数据的保存更是难上加难。很多公司仍然认为保存就是发送电子邮件给托管人,指示他们保存好邮件。甚至当法律部门与IT人员一起保存文件、移动数据到安全的信息库创建多个数据副本、加载网络带宽时可能会干扰商业应用。

网络和个人的繁重工作量。收集和保存分散的数据给网络带宽和存储资源带来严重负荷。而且还严重影响了使用过多时间来收集和评估大量暴露数据的法律和IT人员。甚至当公司使用一些主动的电子发现工具时,例如索引,索引过程本身就是很耗时的,因此会产生连续不断的网络开销。

统一存储库

当尝试为电子发现收集相关数据时,这种高度分散的数据环境带来了真正的难题。在一个特设的基础中搜索所有这些数据受到了严重限制,这在当今快速发展的商业和法律环境下是不能接受的。

解决这些难题的关键是要提供一个能使大部分敏感数据统一在一个单一或虚拟信息库中的方法。并没有完美的方法——物理存储库要求公司投资于一个新的归档平台,而虚拟信息库需要技术,例如索引,其本身就有一套难题。但两种方法已经远远超越了在网络服务器、旧的备份磁带和和托管硬盘中搜索的传统方法。

要知道一个高性能和可防御的统一信息库可使搜索和收集更加高效和成本有效。这并不是你唯一需要的工具,你也需要技术来为保存和处理数据搜索终端存储设备。大多数电子发现信息库厂商将提供这种类型的能力,或将工具结合来实现。但我强烈建议在积极地统一大量的敏感数据(非结构化数据归档)后再展开你的电子发现过程。

 

责编:张欢
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918