Hortonworks'的Hadoop发行版亮相

对于它的第一个版本的Hadoop,Hortonworks的重点是使数据分析软件易于部署和监视

对于什么将是其主打的Apache Hadoop发行第一产能的释放,Hortonworks一直专注于提供一套工具,以帮助部署,管理和扩展数据分析平台。

9开源大数据技术公司观看

“Hortonworks的目标是让Hadoop易于使用和消费,”Hortonworks营销副总裁约翰·克瑞萨(John Kreisa)说。

在Hortonworks数据平台(HDP),6月15日发布的第1版,将是Hortonworks的第一个生产就绪的产品发布。Hortonworks成立一年前雅虎,与标杆资本一道,为企业提供支持Hadoop的,大型数据分析平台。雅虎起到了举足轻重的作用,在Hadoop的早期开发中。

Hortonworks目前正在与其他一些公司竞争,这些公司也提供云计算、MapR和IBM等软件包。微软已选择Hortonworks'关于其Azure云服务使用的Hadoop发行版,但该服务,到2011年年底答应了,还没有开张。

喜欢其他商业Hadoop的包,HDP打包了许多不同的开源的Hadoop组件,包括猪脚本引擎的仓库软件的最新版本,蜂房数据和HBase的数据库。

除了这些基本成分,Hortonworks增加了一些额外的管理和互操作性的工具包,他们都基于开源项目也是如此。

要在管理援助,该软件包包括一个定制版本阿帕奇Ambari,一个Hadoop监视和生命周期管理程序。使用该软件,管理员可以跨多个服务器设置单个Hadoop实例。一旦安装了Hadoop,该软件就会监视服务器的性能以及Hadoop作业本身,并将数据显示在仪表板上。

Kreisa说:“仪表板是可定制的,api[应用程序编程接口]允许管理和监控功能绑定到第三方仪表板,如惠普的OpenView或Teradata的观点。”

在这个版本中,管理工具只能够管理单个集群,但未来版本可能能够管理多个集群,阿里Zilka,Hortonworks首席产品官。正在拍摄的特定度量包括网络利用率,吞吐量和延迟,和CPU,内存和磁盘的使用。在Hadoop作业也测量,包括它需要一个任务的时候开始,有多少任务上有积压,有多少数据块任务的用途以及这些数据块的位置。

对于数据的互操作性,该软件包包括一个元数据目录应该更容易使商业智能和其他数据分析产品查询Hadoop的数据集。基于阿帕奇HCatalog,此元数据储存库提供了一组可以通过通常用于关系数据库,企业数据仓库和其它结构化数据的系统的工具被容易地查询表的指针的Hadoop数据。

包装还包括了Talend开放工作室,它提供了一个探索,查询和应用逻辑的工作流程,以Hadoop的数据集的GUI(图形用户界面)的副本。

创建于2005年,以分析大量的网络流量日志,越来越多地被用于分析非结构化数据过于庞大和笨重的大片的Hadoop被塞进一个关系数据库或企业级数据仓库 - 数据通常被称为大数据。在调查结果周二公布的IT咨询公司Capgenimi,58%的600个高级业务和IT高管们表示,他们计划投资于大数据系统,如Hadoop的,在未来的三年。

HDP使用Hadoop的软件版本1,一般认为第一个生产就绪的软件版本。HDP已经处于测试阶段被测试的过去七个月

除了宣布这一版本中,Hortonworks还宣布,它已与VMware联手提供了一套工具,以在高可用性(HA)模式下运行HDP。的VMware的vSphere可以监控Hadoop的NameNode和JobTracker的服务。如果一个的这些服务失败时,vSphere可以重定向操作,在线备份服务,并保持集群中运行。

HDP本身将可免费下载。使用类似于Red Hat的付款模式,Hortonworks将提供支持订阅。定价是基于每个集群的基础上,开始为每年$ 12,500的10个节点。

约押·杰克逊报道企业软件和通用技术的突发新闻IDG新闻服务。按照约押在Twitter上@Joab_Jackson。约押的电子邮件地址是Joab_Jackson@idg.com

加入对网络世界的社有个足球雷竞技app区Facebook的LinkedIn对最重要的话题发表评论。

版权所有©2012Raybet2

IT薪资调查:结果是