当谷歌宣布2015年5月Bigtable的Beta测试时,新数据库作为服务的人们从使用HBase或Cassandra的人们吸引了很多兴趣。这并不奇怪。现在,云Bigtable一般可用,它应该从想收集和分析极大的数据集的人更多的关注,而无需构建,运行和冒出缩放自己的巨大数据库集群的细节。
Cloud Bigtable是一个公共,高度可扩展的专栏的NoSQL数据库,作为使用与Google的内部版本相同的代码,谷歌在2000年代初而发明发表了一篇论文2006年。Bigtable是许多Google服务的潜在数据库,包括搜索,分析,地图和Gmail。
Bigtable启发了几个开源NoSQL数据库,包括Apache HBase,Apache Cassandra和Apache Accumlo。HBase设计为基于纸张的Bigtable的实施,并成为Hadoop的主要数据库。Cassandra在Facebook上出生使用来自Bigtable的想法和亚马逊Dynamo。Accumulo是一种分类的分布式键值存储,具有基于单元的访问控制,起起了NSA在BigTable上的安全拍摄。
虽然HBase在阳光下的时刻,但它的市场份额现在并不像在几年前那样大的。如马特·薄塔解释说明今年早些时候,“其狭隘的实用性和固有的复杂性具有呼吸倾斜的流行度,并且允许其他数据库索赔大数据冠。”随着Rick Grehan在2014年解释的深度,HBase有太多的移动部件这太难以建立和调整凡人。
虽然Cassandra有点流行,但有一个类似SQL的查询语言,而且比HBase更容易起来,它仍然复杂并且具有重要的学习曲线。Accumulo更多的是利基数据库,主要是为政府申请提供服务。