斯通布雷克/德威特和eBay满贯的MapReduce(再次)

去年八月,Greenplum的和ASTER数据做了一个非常有吸引力的情况下企业使用DBMS集成的MapReduce。尽管缓慢通过,我仍然认为情况有可取之处。周一然而,是一个糟糕的夜晚为MapReduce的倡导者。首先,著名的MapReduce怀疑迈克尔·斯通布雷克和大卫·德威特发布了一系列基准测试的暗示MPP数据库管理系统远远跑赢大盘的MapReduce。计算机世界应该尽快发布相关的故事。我堆在由偶数更持怀疑态度的eBay,认为其发布的一些想法MapReduce的是6-8X慢于MPP数据库管理可比任务。

这并不意味着MapReduce的倡导者需要跳窗台了。很多东西,这些基准表明是应该具备的,是很明显点MapReduce的不应该取代目前用于任务DBMS DBMS所擅长的。MapReduce应用往往集中在四个方面

  • 文本标记化,索引和搜索
  • 其他类型的数据结构中的创建(例如,图表)
  • 数据挖掘和机器学习
  • 数据转换

和基准并没有真正对所有这些发言。但一些这样的地区也可以同样牺牲品“不要重新发明轮子的说法。”例如,LinkedIn是MapReduce的比较著名的用户进行文本处理的一个LinkedIn的文本处理是可怕的

MapReduce的肯定是对轻便,可靠的并行编程一个吸引人的范例。至少对于研究并行算法,它有很多可取之处。但是否将MapReduce的在这一点上似乎发挥了重要作用在生产中使用前进仍然是一个悬而未决的问题。Facebook和Cloudera的当然认为它会。)请继续关注进一步的研究。

加入对网络世界的社有个足球雷竞技app区Facebook的LinkedIn对那些顶级心态的话题发表评论。

©2009Raybet2

IT薪资调查:结果是