Hadoop初创公司Cloudera是如何发展的

目标是让Hadoop对企业员工来说像基于sql的BI工具一样容易

作为Cloudera Dta平台的一部分,一个数据集成应用程序将在本季度正式发布。

Cloudera Inc.正在调整其商业模式。

这家公司最初的名字是Hadoop红帽——开源数据管理平台的付费支持提供商。

去年秋天,加州伯林盖姆的一家初创公司发布第一款产品——Cloudera Desktop,一个管理控制台。

此后,该公司还悄悄发布了一款专有的数据集成应用。Cloudera首席执行官迈克•奥尔森(Mike Olson)表示,它“不会取代Informatica或Ab Initio”,但它确实提供了提取和转换功能。

作为Cloudera Dta平台的一部分,这个数据集成应用程序将在本季度正式发布。奥尔森说,目前还没有确定价格。

这只是Cloudera正在努力开发的功能之一——分析和BI仪表板是另一个功能——使其Hadoop版本对主流企业员工来说像基于sql的商业智能工具一样容易使用。

“MicroStrategy,业务对象,甲骨文这些产品都非常强大,而且对于业务分析师来说非常容易使用。”Olson说。相比之下,除了“硬核Java黑客”,Hadoop仍然是一种威胁。

“Hadoop需要变得更简单。它功能强大,但需要相当多的编程。

奥尔森说,Cloudera目前有30家客户,大多数来自政府、金融服务和零售行业。他们包括LinkedIn, eHarmony, JP摩根大通,以及许多在去年秋天的首届HadoopWorld大会上发言的其他公司。

Cloudera已经筹集了资金通过两轮风险投资获得1100万美元该公司计划今年将其27名员工的人数增加一倍,以帮助主流企业转向NoSQL的替代品比如Hadoop及其前身,MapReduce。

他说:“我们在2010年的目标是向那些从未接触过Hadoop的企业展示,如何通过将其与新的数据类型结合,从关系数据库中已经收集到的数据中获得更多价值。”

虽然Olson承认SQL对于今天的许多用户来说是一个更简单、更强大的环境,但他说Hadoop很快就会赶上来,因为它们“创新得更快”。

他说:“为什么我们不看看Oracle要多久才能发布另一个主要版本呢?”

与基于关系的数据集市或数据仓库相比,Hadoop更擅长处理不同的数据类型,后者迫使您提前为数据创建模式。

Olson认为,Hadoop的可扩展性也是如此,他说有很多Hadoop集群存储的数据“众所周知,有好几pb大”。他拒绝透露这些公司的名字,也不愿透露它们是否是Cloudera的客户。

尽管Hadoop技术具有作为可扩展的通用数据存储的潜力,Olson认为它是关系数据库的补充,而不是竞争。

“和拉里·埃里森竞争有点糟糕,”奥尔森说,他指的是他以前的公司SleepyCat Software,嵌入式数据库制造商BerkeleyDB被甲骨文收购在2006年。“我终于把公司卖给了他。所以我不想再和他(竞争)了。”

Cloudera还与Vertica Systems Inc.密切合作,使用户能够将存储在Vertica基于sql的数据仓库中的数据与Cloudera连接起来,反之亦然。

Olson将Cloudera的产品与关系数据仓库供应商(如Greenplum Inc.和Aster数据系统人介绍Hadoop MapReduce /功能。

“在我看来,Aster Data和Greenplum使用的不是MapReduce……它只与关系数据有关,而不是一般数据。”“你选择Greenplum [MapReduce]的原因是,你已经是Greenplum的客户了,而不是因为你想要MapReduce。”

Eric Lai为Computerworld讲授Windows和Linux、桌面应用程序、数据库和商业智能。在Twitter上关注Eric @ericylai,发送电子邮件到elai@computerworld.com或订阅Eric的RSS订阅。

这篇题为“Hadoop初创企业Cloudera是如何发展的”的文章最初是由《计算机世界》

加入网络世界社区有个足球雷竞技app脸谱网LinkedIn对自己最关心的话题发表评论。

版权所有©2010 IDG ComRaybet2munications, Inc.

SD-WAN买家指南:向供应商(和您自己)提出的关键问题