瑞星数据加载速度可能会离开BI用户的背后

供应商正在加载信息到数据仓库吹捧快速的时代。但有需要的那种速度的?

一个数据仓库的较为平淡的部分之一是获取信息到摆在首位的一个仓库。开发商们销售数据加载工具已经在的阴影长期运行商业智能市场,在的世界孤立潇洒一点或glory.Even提取,转换和加载(ETL)软件,焦点历来是更多的清洁和修改数据,为分析用途做准备的问题。数据加载似乎是一种事后的想法 - 一块蛋糕 - 在comparison.But情况已有所改变的BI和分析越来越近实时的事务的许多公司。此外,最大的BI用户现在运行数据仓库不是在大小和需要进口大量的数据放进去一个PB级大。例如,决策支持数据库厂商Teradata数据公司说,eBay公司50TB的负载在日常basis.Over网上拍卖和购买数据在过去几个月里,一些初创公司和相对不知名的厂商都试图兜售尖叫快速的数据加载速度,他们声称已经在任一实现以利用这种需求在field.Database实验室或与用户启动的Greenplum公司表示,客户福克斯互动媒体公司经常加载Web使用数据的2TB到其数据仓库在半小时内。与此同时,竞争对手ASTER数据系统公司宣称,高达每hour.Not 3.6TB其nCluster技术支持负载速度也不甘示弱,膨软件公司,一个ETL启动提供所谓的语义数据集成工具,在说-house测试表明,其数据处理引擎可扩展到近11TB每hour.Even Syncsort的公司,一名41岁的公司开始作为一个大型软件供应商,已经得到插一脚的速度。Syncsort公司说,在实验室测试中,它的数据集成软件加载的数据5.4TB到少周围Vertica的系统公司的列式数据库的建立比hour.If Syncsort公司和其他供应商的仓库实际上是实现这些类型的负载率,这是“让人印象深刻,说:” Forrester研究公司“任何一个TB级每小时好。上面”又是怎么回事更老牌厂商的分析师James Kobielus说?两年前,SAS软件研究所和Sun Microsystems公司展示了在Sun硬件和可以通过数据1.7TB在17分钟内推的StorageTek磁盘阵列中运行的SAS数据仓库 - 相当于不到6TB每hour.But其他大-name厂商都已经发布落在由暴发户声称负载率的短期业绩基准。去年秋天,例如,甲骨文公司和惠普公司表示,他们的联合BI-导向HP Oracle数据库机可以加载高达1TB每小时。和微软公司说,去年年初,该数据集成软件内置到SQL Server 2008中在2.36TB的速度就装好每hour.But做客户真正需要的超快加载速度是厂商一直吹捧最近?毫无疑问,约翰·罗素,膨首席科学家争辩说,许多人。“每一个金融公司,我们议论着说,他们希望。一些接近1TB每天,”他说。“对于点击流数据[从网站],这些数字可能高达200次十亿的点击,或近24TB的日子。”一位长期数据仓库架构师财富100家强公司,罗素说他共同创立膨部分“出来的无奈我和那些高端[数据整合]工具。的性能局限和瓶颈打交道时感到“Kobielus说每小时数TB的负载率‘正在成为常态’为存储大量的基于事件的数据仓库,为Web点击流信息或通讯设备产生的呼叫详细记录时,企业需要填充新的仓库或数据集市与快速周转的数据挖掘项目的历史信息systems.They也可以是有用的,例如,Kobielus说这样​​说。但用途企业级数据仓库的主流之外,他补充说。据Kobielus说,大多数仓库还存放数据少于10TB的,只需要加载rates.Independent数据库分析师柯特·莫纳什去年十二月在了类似的观点“每小时千兆字节”博客文章有关Syncsort公司和Vertica的制造性能要求。莫纳什承认,数据加载“是一个日益平凡的主题。”但总的来说,他辩称,商业数据库“将提供大多数用户使用更多的加载速度比实际需要。”彼得·施密特是在炫酷有限责任公司,位于芝加哥的100名员工的网络广告服务公司的商业情报总监。炫酷有适度的数据加载的需求,但施密特在BI工作了超过20年,并在公司与更大的存储需求,如联合航空有限公司和OfficeMax公司Inc.So,可以施密特想象需要一个已挂起作业ETL工具,可以加载4TB以上每小时?“不,还没到那个水平,”他说。而且,他指出,“性能测试出从未有苹果对苹果[与现实世界的应用程序。所以,如果你能在11TB带来每小时什么,但不转变什么,只是从A点移动到数据B点?“即使是Teradata数据持怀疑态度的需求如何广泛的是高端吊装工具。“极端数据负荷率无关,大多数客户环境,”兰迪·李,产品和services.Most供应商的副总裁数据仓库系统,包括Teradata的,可以被配置成加载每小时数据的多个太字节,LEA说。但他告诫说,这种系统是在失去平衡,并在其他方面差强人意的风险,如数据读取和queries.In此外,他表示,“‘天啊’数据加载自夸没有什么价值的当前作物,因为有没有基准。“后一个问题,现在正由事务处理性能委员会,被称为TPC基准开发小组解决。它去年十一月形成ETL基准小组委员会,并首次会议定于本月。这至少可以使BI的用户,看看如何厂商真正堆叠起来互相当谈到压负荷踏板到floor.This故事最初出现在计算机世界的印刷版。它是在我们的网站上以前发布的一个故事的修改版本。

这个故事,“瑞星数据加载速度可能会离开BI用户背后”最初发表计算机世界

加入对网络世界的社有个足球雷竞技app区Facebook的LinkedIn对那些顶级心态的话题发表评论。

©2009Raybet2

IT薪资调查:结果是