三大数据库供应商在Hadoop上存在分歧

通过黎家祥

关系数据库市场的三大领导者正以三种截然不同的方式应对数据处理技术Hadoop的突然狂热。

而Sybase Inc.和Teradata Inc.等初创公司和成熟的数据仓库供应商。我们正在拥抱Hadoop及其谷歌-发达的祖先，地图还原,微软公司正在抵制它。

“我们从未将Hadoop代码引入我们的产品，”他说微软技术研究员以及威斯康辛大学麦迪逊分校的大卫·德威特教授。

德维特对此缺乏兴趣并不奇怪。DeWitt是并行SQL数据库的学术专家，他与他人共同发明了三种数据库。他今年春天与人合著了一篇论文这表明SQL数据库在大多数任务上仍然优于MapReduce。他没有改变主意。

“每个数据库供应商都想声称他们在做Hadoop，因为它是流行的东西，”他说。“FUD太多了。SQL数据库仍然工作得很好。”

德维特领导着麦迪逊的一个数据库研究实验室，该实验室正在帮助微软为其产品进行研发SQL Server 2008 R2即将推出的并行数据仓库版本，原名麦迪逊计划。

因此，他说新版SQL Server将添加一些分析函数，这些函数大致模仿MapReduce/Hadoop的一些功能。

这些增加是合并DATAllegro Inc.技术的结果，该公司微软收购，而不是Hadoop，DeWitt说。

不过，他说，确实承认MapReduce/Hadoop比SQL更能防止长时间运行的查询崩溃。

他说，正因为如此，微软最终可能会尝试将这些功能整合到未来面向数据仓库的SQLServer版本中。

这可能是微软主导的努力，而不是由Apache软件基金会管理的Hadoop开源代码的许可。

IBM是Apache的主要公司支持者。IBM软件集团信息管理部门的首席技术官Anant Jhingran说，也许并不奇怪，它“非常看好Hadoop”。

“我并不是说把Hadoop和数据库结合起来就是解决一切问题的办法，”Jhingran说，“但最后，我认为每一个企业我想要Hadoop。我只是不确定是什么形式。”

关于企业是否希望将Hadoop集成到其SQL数据库中，作为一个单独的数据仓库设备，还是作为一个只包含Web的服务，其中Hadoop隐藏在下面，例如IBM的实验性M2服务。

为了确定这一点，IBM正在与十几家企业客户进行试点，并在实验室进行研发工作，Jhingran说。他拒绝就Hadoop功能进入下一版本DB2或Informix的可能性发表评论。

Jhingran说，有一件事是肯定的:Hadoop最适合用于解决新兴问题，如Web分析、欺诈和非结构化和半结构化数据的分析，而不是关系数据库已经证明擅长处理的问题。

他说：“对于那些只想使用Hadoop构建数据库替代品的供应商来说，我认为他们会一败涂地。”。SQL技术“支持一个3000亿美元的生态系统。它非常强大。我（46岁）没有那么年轻，但我会在SQL退役之前退役。”

这不仅仅是因为甲骨文的关系数据库市场长期处于领先地位，但也因为其数据库因扩展而名声不佳--MapReduce/Hadoop的强大功能。

甲骨文没有回应置评请求。但在10月份，它发表了一篇博客，用独立分析师Curt Monash的话说，该博客认为“实际上，我们一直在做MapReduce。”

Oracle高级产品经理Jean-Pierre Dijcks表示，使用2001年Oracle 9i首次引入的特性，Oracle数据库可以并行处理大数据集。他详细地描述了如何实施在一篇博客文章中。

Dijcks写道：“MapReduce最终是一个编程结构……SQL也将允许大规模并行处理。这完全是一个超越炒作的问题，找到一个您满意的解决方案。”。

这个故事“三大数据库供应商在Hadoop上的分歧”最初由计算机世界 .

加入网络世界社区有个足球雷竞技app脸谱网和LinkedIn评论最重要的话题。