9个领先的商业Hadoop发行版是如何堆叠起来的

所有主要的商业Hadoop发行版都与Apache Hadoop兼容,那么是什么使它们与众不同呢?以下是由Forrester Research确定的主要商业发行版的比较。

大数据,hadoop

大数据和Hadoop正在改变企业数据管理架构的过程。这是一个淘金市场纯戏剧,企业软件供应商和云计算厂商都在争相股权要求。开源Apache Hadoop项目包括核心模块 - 常见的Hadoop,Hadoop分布式文件系统(HDFS),Hadoop的纱线和Hadoop MapReduce的 - 但没有支持或商业供应商的打包解决方案。所有领先的商业分布的是与Apache Hadoop的兼容,所以有什么与众不同呢?以下是9个领先的商用的Hadoop发行版是如何通过鉴定Forrester研究叠起。

亚马逊网络服务弹性MapReduce拥有最多的市场份额

亚马逊网络服务弹性MapReduce拥有最多的市场份额

亚马逊可能不是第一件事情就是弹簧想到当你想到的Hadoop,但AWS”弹性MapReduce (EMR)是市场上的第一个商业Hadoop的产品和潜在客户在全球市场存在的一个,说:Forrester的首席分析师麦克·盖立特里。EMR是云中的Hadoop,利用Amazon EC2进行计算,Amazon S3用于存储和其他服务。

“AWS的解决方案路线图包括整合亚马逊EMR和亚马逊Kinesis,用于流处理;加强与亚马逊红移数据仓库等数据源的整合;自动缩放,将根据策略调整集群大小;在Hadoop上支持额外的NoSQL数据库;与第三方供应商进行更多的BI集成。”Gualtieri写道。

Cloudera公司是一家专注于创新在基于Hadoop的上企业需求

Cloudera公司是一家专注于创新在基于Hadoop的上企业需求

AWS可能在市场占有率方面领先,但它是纯粹的Cloudera是2号,拥有200多个付费用户,其中一些人的超过1000个节点的部署夸比支持PB级的数据更多。

“企业客户需要一个管理和监控工具Hadoop的,所以Cloudera的内置了Cloudera管理器,”盖立特里写道。“企业客户需要Hadoop的一个更快的SQL引擎,所以Cloudera的内置帕拉使用大规模并行处理(MPP)架构 - 相同的架构,EDWs使用Cloudera的创新方法是要忠诚于核心的Hadoop,但快速,积极创新满足需求,有别于其他供应商的“。Cloudera的收入模式主要是基于软件的订阅,但它也提供了支持。

Hortonworks驱动器的开源Hadoop的创新

Hortonworks驱动器的开源Hadoop的创新

所有玩家的,纯粹的Hortonworks他拥有与Apache Hadoop开源社区最接近的Hortonworks数据平台(HDP),但也积极寻求与微软、Teradata、SAP、红帽等公司的深度工程合作。

“Hortonworks的战略是推动所有的创新通过开源社区,并创建加速企业间的Hadoop采用合作伙伴生态系统,”盖立特里写道。“凡开源社区并不够快,Hortonworks将启动新的项目,并承诺Hortonworks的资源,让他们掉在地上。”

提供Hadoop集群管理控制台的Apache Ambari就是一个关键的例子。

IBM InfoSphere BigInsights拥有IBM的企业影响力

IBM InfoSphere BigInsights拥有IBM的企业影响力

IBM虽然它没有竞争对手吹嘘的Hadoop社区的深度,但它在分布式计算和数据管理方面有很深的根基,这使它能够提供全面的Hadoop解决方案。它已经部署了100多个Hadoop,其中一些可以运行pb级的数据。

“此外,IBM拥有先进的分析工具,一个全球性的存在和实施服务,因此它可以提供一个完整的大数据解决方案,将成为许多顾客的吸引力,”盖立特里写道。“IBM的路线图,包括继续与IBM有关的资产像SPSS高级分析,工作负载管理为高性能计算,BI工具和数据管理和建模工具的BigInsights Hadoop的解决方案集成。”

MAPR技术信息支持NFS和其他创新

MAPR技术信息支持NFS和其他创新

MAPR技术是名单上的第三个纯粹的,但缺少了Cloudera和Hortonworks的市场占有率。在早期,就开始专注于企业的功能,同时多数企业仍处于概念阶段的证明评估的Hadoop。

“MAPR技术增加了一些独特的创新,它的Hadoop发行版,包括网络文件系统(NFS)支持,运行在集群中的任意代码,性能增强HBase的,以及高可用性和灾难恢复功能,” Gualitieri写道。盖立特里指出,现在MAPR公司的竞争对手们紧紧围绕构建了企业功能,以及,公司需要专注于在市场上制造噪音,并建立了其伙伴关系和分销渠道。

Pivotal软件公司充分利用了它的Greenplum工程师

Pivotal软件公司充分利用了它的Greenplum工程师

掌舵EMC和VMware,与前的VMware首席执行官Paul Maritz的纺出,关键的软件有EMC技术顾问和数据科学家做后盾。除了从EMC带来的columnar Greenplum数据库技术之外,Pivotal的Hadoop发行版还有一个名为HAWQ的MPP Hadoop SQL引擎,它在Hadoop上提供了类似于MPP的SQL性能。

Pivotal是第一个提供全功能企业级Hadoop设备的EDW供应商;它也是第一个推出将Hadoop、EDW和数据管理层集成在一个机架上的设备系列,”Gualtieri写道。“Pivotal的路线图将使其Hadoop解决方案更具竞争力;它的创新集中在改进HAWQ SQL引擎和与其他关键产品的集成。

Teradata正在将其专业知识应用到Hadoop设备中

Teradata正在将其专业知识应用到Hadoop设备中

Teradata是企业数据仓库(EDW)设备方面的专家,并在此基础上与Hortonworks建立了强大的技术合作伙伴关系,以提供作为设备的Hadoop。

“用于Hadoop的Teradata发行版包括了与Teradata管理工具和SQL- h的集成,SQL- h是一个联邦SQL引擎,允许客户从它的数据仓库和Hadoop查询数据,”Gualtieri写道。“它还拥有用于分析Hadoop的Aster。”

Teradata的目前有不到100个客户,其Hadoop的应用,但盖立特里指出,其广泛的资金,技术和管理资源,使其能够创造一个独特的和高性能的设备,这将是困难的其他厂商相匹配。

英特尔为Hadoop提供了硬件增强的性能和安全性

英特尔为Hadoop提供了硬件增强的性能和安全性

英特尔在Hadoop分布空间中,英特尔是一个相对较晚的竞争者,但它依靠其英特尔至强芯片的能力使其成为一个竞争者。

Gualtieri写道:“它是第一家为Hadoop提供硬件增强的性能和安全能力的供应商。”英特尔明年的发展蓝图将使其在Hadoop解决方案市场上更接近并与其他供应商持平。此外,英特尔继续专注于硬件增强的性能和安全特性、本地任务优化、Lustre和图形分析,这将使其分布差异化,使其具有吸引力的前景。

微软的Windows Azure HDInsight拥有云的力量和背后的Windows

微软的Windows Azure HDInsight拥有云的力量和背后的Windows

设计是与Hortonworks工程合作的一部分,微软Windows Azure HDInsight服务是专门为Windows Azure云设计的。HDInsight和Windows的Hadoop (Hortonworks数据平台的一个版本)包含了唯一在Windows环境中运行的Hadoop发行版。

“微软还提供了多碱,让SQL Server客户执行的查询还包括存储在Hadoop中的数据,”盖立特里写道。“微软对其他开源社区的Hadoop项目显著工程工作,包括下一代数据库中的蜂房。微软的显著存在,数据仓库,云,OLAP,BI,电子表格(PowerPivot的),协作和开发工具市场提供的优势,当涉及到提供一个成长的Hadoop堆栈微软的客户“。

版权©2014Raybet2