想试试的人被大肆宣传的Hadoop但由于Hadoop分销商Hortonworks发布了一个新版本,现在没有一两个集群可以在他们的桌面上测试数据处理平台。
Hortonworks沙箱是Hadoop的单节点实现,基于Hortonworks数据平台。它封装在虚拟机中,包含了Hadoop部署的所有典型组件,包括HCatalog存储管理子系统、Hive数据仓库和Pig数据分析工具集。
Hortonworks服务营销总监Cheryle Custer表示,该软件包还提供了许多教程,向用户展示如何执行Hadoop数据分析任务。这个包包括三个教程,更多的教程将在未来几个月提供下载。该软件包还包括视频,甚至在线数据集,可用于测试功能。
虽然Hadoop被广泛使用,但它对新用户来说是一个学习的挑战,至少对数据科学家和任何不是系统管理员的人来说是这样。该软件需要大量的工作设置和运行。除了安装软件和Java虚拟机(如果系统上还没有Java虚拟机的话)之外,用户还必须安装文件系统,并且软件本身需要一个用户帐户,这可能会带来安全风险。
Hortonworks沙箱消除了所有的安装工作,只需要用户下载并运行一个虚拟机。虚拟机包构建在CentOS Linux发行版上,可以在VMware和Oracle virtual Box环境中运行。
除了构建Hadoop沙箱之外,Hortonworks的工程师们还忙于开发该公司的旗舰企业Hadoop分发版。Hortonworks数据平台版本1.2,上周发布的,提供新的管理和安全工具。
约押杰克逊报道企业软件和通用技术突发新闻IDG新闻服务.请在Twitter上关注约押@Joab_Jackson.约押的电子邮件地址是Joab_Jackson@idg.com