问答:勤奋CTO demysties数据重复数据删除

勤奋技术是数据重复数据删除技术的先驱之一,这有助于企业减少数据冗余副本,然后依次收缩存储要求和缩短备份时间。Neville Yates,Diligent的CTO,与网络世界高级编辑Deni Co有个足球雷竞技appnnor谈论了与当今虚拟磁带库(VTL)一起使用的不同重复数据删除技术。

勤奋技术是数据重复数据删除技术的先驱之一,这有助于企业减少数据冗余副本,又缩小存储要求和缩短备份时间。内维尔yates,勤奋的CTO,与之交谈有个足球雷竞技app高级编辑Deni Connor关于今天使用的不同重复数据删除技术虚拟磁带库(VTL)。

那么重复数据删除是什么?

重复数据删除是一种方法,通过将数据进行检查和与现有数据进行比较。如果它是相同的,则会过滤滤除并引用现有数据。重复数据删除在备份等应用中非常突出,导致大量重复作为它们如何工作的副产品。这些应用是重复数据删除技术的主要目标。

有什么形式的重复数据删除?

在市场上谈到了重复数据删除有三种方式。其中一个是从勤奋的议员发售,称为hevelfetor,它以可靠形式查看数据,并搜索数据流以进行相似性。一旦找到相似性,执行计算差异,保证了要滤除的内容与引用的内容完全相同。仅存储新数据。

另一个使用哈希技术或散列算法,其中数据被切成一些可消化的作品 - 例如,大小可能8kbytes - 并且将散列分配给该数据并存储数据。如果该签名或哈希重新计算在新数据流上,则该计算表明数据已存在并且可以引用。它不需要消耗更多存储,从而减少所消耗的存储量。

第三个是在其逻辑内容中查找内部的数据流的一个,假设特定名称的文件最有可能是在完全合格的基础上完全相同的文件的内容时成为一个好的候选者,含义目录,目录树等,然后在两个文件之间完成计算差异。

因此,有三种基本方法和许多不同的实施方法。

重复数据删除已实施的不同方式是什么?

这些方法中的一个实现差异是您是否收到所有数据并将其置于磁盘上,然后在将来的某个时间从重复数据删除的角度读取它,或者在收到您在内联处理它的数据期间实时实现重复数据删除。

那些被称为内联和后处理?

那是正确的。

您说勤奋使用HyperFactor方法。谁是使用哈希算法的一些供应商?

散列或其一些衍生物被使用量子/ adic数据域Falconstor.。HyperFactor是我们自己的IP。内容感知是次次追求的东西。

内联重复数据删除和后处理有哪些优缺点?

内联重复数据删除首先难以在性能方面实现。但如果你确实实现了它,它是有利的,因为一旦完成了这项工作,就完成了工作 - 没有繁重的升降,你不必担心任何背景任务的容量规划以及可能提供的资源支持这一点。与后处理相反,虽然备份应用程序正在接收到数据,但尚未完成繁重的升降,因此最终用户需要涉及完成后处理所需的努力量。

当您在封面下看磁盘子系统的活动大大增加时,它非常容易理解,因为您必须编写所有内容并读回来,因此只有原因是磁盘子系统的活动大大增加。然后,所有数据库和索引开销都很痛苦,可以减慢过程。断言是非常合理的,如果您能够将300到400MB的内联嵌入式符合责任,您甚至不能考虑执行后处理,因为情况会推向更高的I / O配置文件并使您减慢。

除了勤奋之外,谁是一行重复数据删除的供应商?

我相信数据域是唯一一个在线处理的供应商。对早期Beta测试的结果非常有趣的是,当您有一个待处理的数据存储库时,我们使得后处理缓慢的声明。一个大型存储库,尤其是当它基于哈希时,导致知识库,索引和目录令人难以置信的活动。当我说大时,我的意思是20,30或40tb的大小。

如果您使用磁盘作为端点而不是磁带,请选择后处理或内联处理的系统更好,或者它会产生差异吗?

决策点将基于工作量的大小。如果您只有一个小工作量,并且只有每晚备份1TB,那么就有许多不同的产品可能就足够了。还有其他属性与可伸缩性,配置和扩展的灵活性有关。当您正在查看大量数据时,您真的需要担心支持有效载荷所需的配置,当它达到10到20TB时。如果您正在处理那些大型有效载荷,您可能会发现自己购买更多硬件以支持后处理部署。

如果我的目标是从磁盘上的暂存区域向磁带发送数据,我是否需要在将其关闭到磁带之前取消复制该数据?

是的,您应该因为将其放在磁带上的好处可能会在现场发送它,并且您的使用简介在所有需要对该数据的原生访问的所有概率中都决定,这意味着NetBackup,TSM或Legato可以直接使用这些磁带。如果使用数据然后将其放在磁带上,它是一个私有的专有格式,需要未经解复复,以便将数据用于任何应用程序。

在虚拟磁带库以外的地区似乎还有重复数据删除的机会吗?

重复数据删除适用于任何目标。勤奋将使用网络文件系统接口引入文件系统重复数据删除,并利用我们的重复数据删除引擎到网络附加的存储拓扑。我们还在开发一种支持NetBackup的图像界面。该技术不受VTL的约束。

了解有关此主题的更多信息

节省重复数据删除的空间

11/02/06

重复数据删除:停止重复自己

09/25/06

视频:通过虚拟磁带更好地备份

07/17/06

加入网络世界社区有个足球雷竞技appFacebooklinkedin评论是最重要的主题。

版权所有©2007.Raybet2

IT薪水调查2021:结果是