仅在几年前,数据库的工作是在IT任务的最无聊之中 - 在一个好办法。数据走进各大SQL数据库之一,后来就出来了,都在一块,正是因为它走了进去,数据库制作者已经成功地提供坚如磐石的性能,每个人都开始理所当然。
那么,我们需要什么性质存储所改变。数据库必须超越银行账户和飞机票移动,因为每个人都已经开始在社交网络上共享数据。突然有更多的数据存储,并且大多数这个新的数据并没有融入旧表。数据库管理员和创作者的工作转变,什么又出现了一个耐人寻味的广泛的解决方案,帮助使今天更加吸引人的技术之一数据库阵列。
Cassandra, MongoDB, CouchDB, Riak, Neo4j——过去几年的创新现在已经在许多组织中得到了很好的应用。但新一代正在迅速崛起。在这里,我们将概述11个经过调优的前沿数据库,这些数据库将以更灵活的格式在更多的机器上存储更多数据,从而可以通过多种方式进行查询。
数据库世界从来没有像现在这样多样化和有趣。
FaunaDB
当一些来自Twitter的难民想要利用他们处理数十亿条tweet所获得的经验来建立一些新的东西时,他们决定一个分布式数据库是正确的挑战。输入FaunaDB。输入JSON,然后从分布的节点集合中得到答案。在通过社交网络和数据库中的其他图形结构进行搜索时,FaunaDB的查询语言提供了将来自不同节点的数据结合在一起的复杂问题的能力。
如果您只是对试验感兴趣,或者不想麻烦地滚动自己的数据库,FaunaDB提供了一个云数据库即服务版本。如果您希望获得更多的控制,可以在自己的iron上安装企业版本。
ArangoDB
您不会是第一个举手说:“如果我们能将文档样式数据库的灵活性与图形数据库的特殊能力结合起来,还能获得表格数据的灵活性该多好。”然后我们就可以制作了。”
不管你信不信,旨在满足这些需求的数据库已经在这里。ArangoDB允许您在文档或图形数据库中粘贴数据。然后,您就可以编写真正具有join循环的查询,这些查询在数据库上运行,并且具有所有的局部性,从而使处理这些查询的速度更快。对了,查询语言是用JavaScript封装的,它通过RESTful API公开微服务。这是一种能让很多人开心的方法。
OrientDB
ArangoDB是不是在镇上试图混合图形和文档数据库的权力的唯一工具。OrientDB执行类似的操作,但是将其本身打包为“第二代图形数据库”。In other words, the nodes in the graphs are documents waiting for arbitrary key-value pairs.
这使得OrientDB觉得自己像一个图形数据库第一,但没有理由你不能单独使用的key-value存储。它们还包括一个RESTful API等待你的查询。
Crate.io
有多少次你发现自己希望像Lucene的,但与结构的搜索引擎的动力和易于查询的SQL?如果答案是大于零,Crate.io也许是答案。
虽然Lucene最初只是一个搜索引擎,用于在大的、非结构化的文本块中查找关键字,但它总是提供在每个文档中存储键和匹配值的功能,这让一些人认为它是NoSQL革命的一部分。Crate.iostarted with Lucene and its larger, scalable, and distributed cousin Elasticsearch but added a query language with SQL syntax. The folks behind Crate.io are also working on adding JOINs, which will make Crate.io very powerful -- assuming you need to use JOINs.
喜欢老式SQL思维方式的人会喜欢板条箱这个事实。io以一种更容易使用基于sql的系统的方式捆绑了更新的、可伸缩的技术。
CockroachDB
这个名字可能不那么吸引人,但人们的感受却很吸引人。CockroachDB的开发人员拥抱的想法,没有任何生物是持久的或有弹性的蟑螂,吹牛,‘CockroachDB使您能够部署在同行业最强的灾难恢复故事的应用程序。’
虽然时间会告诉我们他们是否真正实现了这个目标,但这并不是因为缺乏工程技术。该团队的计划是使CockroachDB易于扩展。如果添加新节点,CockroachDB将重新调整自身以使用新空间。如果杀死一个节点,它将收缩并从备份源复制数据。为了增加额外的安全性,CockroachDB承诺跨整个集群的完全序列化事务。您不需要担心数据,顺便说一句,数据存储为“从键到值的单一、单块映射,其中键和值都是字节字符串(不是unicode)”。
RethinkDB
在传统数据库中,发送一个查询,数据库发送一个答案。如果不发送查询,数据库就不会发送任何东西。它很简单,对某些应用程序很完美,但对其他应用程序则不然。
RethinkDB反转的旧模式,将数据推送到客户端。如果查询的答案改变,RethinkDB发送新数据到客户端。它非常适合一些在同一时间一起是帮助多人编辑文档或工作即将上演示了新的交互式应用程序。从一个用户更改保存到RethinkDB,其及时向他们关到其他用户。该数据被存储在JSON文件,这是理想的Web应用程序。
InfluxDB
有些数据库要保存所有的在世界上的信息。InfluxDB只想要时间序列数据,源源不断的数字。它们可能是网站上的日志文件,也可能是实验中的传感器读数,但它们会不断出现,并希望被分析。
InfluxDB提供一个基本的HTTP(S)API添加数据。对于查询,它有一个类似于SQL的语法,其中包括一些基本的统计运营商一样的意思。因此,你可以要求的平均时间超过一个特定的值,它会计算数据库中的答案不发送的所有数据传回给你。这使得构建的时间序列的网站容易和高效。
Clustrix
Clustrix它可能不再是一个新产品——它的最新版本是6.0——但它仍然称自己是新sql革命的一部分,因为它提供了自动复制和集群,速度与内存中的数据库相当。Clustrix背后的人员已经添加了大量管理工具,以确保集群可以在数据库管理员不太关注的情况下进行自我管理。
也许它更有意义看版本号为成熟和经验的标志。你得到的,只有从几年的测试自带保证新思路乐趣所在。
NuoDB
如果你有数据要通过分布式数据库网络传播到世界各地,NuoDB已经准备好为您存储它,并具有所需的所有并发控制和事务持久性。其核心是一个“持久分布式缓存”,它吸收您的查询并最终将数据推入一个持久磁盘。与缓存的所有交互都可以使用ACID事务语义来完成——如果您愿意的话。可以调整提交协议,以牺牲速度换取持久性。
该软件包包括各种各样的管理工具,用于跟踪系统中的节点。所有查询都使用类似sql的语法。
VoltDB
一些数据库存储信息。VoltDB旨在分析它的同时,提供“流分析”,即“以毫秒为单位交付的决定。”数据到达在JSON或SQL,然后被存储并且以相同的过程,这是顺便用Hadoop集成,以简化计算复杂的分析。哦,它也提供ACID事务保证到存储。
MemSQL
RAM从来没有便宜 - 或更快 - 和MemSQL准备好可以很容易地保留所有的数据在内存中,以便查询可以回答比以往更快。这就像一个智能高速缓存,而且还可以在一个集群中复制自身。一旦数据在RAM中,它也很容易与内置的分析来分析。
最新版本还支持地理空间数据的存储和分析。当应用程序在世界各地移动时,创建具有地理感知的移动应用程序并产生分析结果是很容易的。
相关文章
- 快速指南:我应该使用哪个该死的数据库?
- SQL发动:更快的SQL查询17个秘诀
- Bossie奖2015:最佳的开源应用程序开发工具
- 现在值得学习的9种前沿编程语言
- 8 MySQL的陷阱值得夸大其词
- 7个基本的SQL服务器安全技巧
- 为什么你的下一个数据库,将是开源
- MongoDB、Cassandra和HBase——我们要关注的三个NoSQL数据库
这个故事,“现在值得探索的11个前沿数据库”最初是由InfoWorld的 。