对NoSQL的隐性成本

NoSQL的是一个功能强大的数据模型,但或许不足以证明许多独立的数据存储。

肖像历史

该供应商编写的技术底漆已经被网络世界编辑,以消除产品推广,但读者应该注意到它可能会倾向于提交者的做法。有个足球雷竞技app

NoSQL的行业是在无架构设计,无限扩展的集群和突破性的性能的承诺,迅速发展。但也有隐性成本,包括数据存储的无限选择的增加的复杂性(现在编号225),实现在不SQL分析是痛苦的,高延迟查询您需要预先计算结果和低效利用的硬件导致的服务器蔓延。

所有这些费用加起来的照片远不乐观比最初呈现。然而,对于NoSQL的数据模型有一定道理某些工作负载,跨键值和文件数据的类型。幸运的是,现在,这些被结合成表示简化和统一的数据管理方法的多模式和多模式的数据库。

让我们在推动了NoSQL运动和放弃SQL的真正影响一探究竟。

黎明和NoSQL运动的衰落

NoSQL的普及是因为需要超越传统的基于磁盘的关系数据库可以处理的规模增长,因为从大型数据库公司高性能的解决方案变得非常昂贵的非常快。再加上数据的增长,开发人员需要一个更好的方式对于像移动应用程序关联的用户和个人资料信息越来越多地使用简单的数据结构。NoSQL的答应了一条捷径性能。

对于NoSQL的流行的另一种解释来自于人们认为SQL是很难学。但迈克尔·斯坦克,在木偶实验室工程总监,声称是年初和无效的说法,并指出,“相反,你必须学会​​每次使用一个工具查询语言。”

有几件事情在最近几年,已经导致对NoSQL同化到更广阔的数据库市场变化。

首先,在内存架构已经证明,你可以拥有性能和SQL在一起,满足对最初开沟SQL的部分原因。

其次,大多数的NoSQL数据存储开始键/值工作量有限的语言,然后尝试更类似于SQL的结构,甚至尝试重新创建SQL本身。与SQL开始意味着你纳入核心的架构特性,如多版本并发控制(MVCC)或索引,既至关重要的实时分析不断变化的数据集合。

最后,关系数据库厂商已经通过将他们变成一个全面的产品公认的多个数据模型的价值。

也许NoSQL的消逝最好由领先的分析公司Gartner的总结:“到2017年,在‘NoSQL的’标签将不再区分数据库管理系统,这将减少在它落下的使用了它的价值和结果”(如报价Dataversity)。

SQL的价值

讽刺的是,继NoSQL的炒作,SQL的作为一种层已立即变得公司和数据存储都宝贵的价值。见证SQL作为一种层与像帕拉(Cloudera的)项目从Hadoop的数据抢救力度,钻(MAPR),和蜂巢(Hortonworks),以及像普雷斯托解决方案在Facebook上开发的。

而像处理星火框架,其受欢迎的星火SQL函数,已被证明是为留在剪辑室地板SQL回文件和键值数据存储一个救命之恩。

与此同时,在内存中,分布式系统实现关系模型保持不动,实现突破性的性能和规模为现代的工作负载,并纳入NoSQL数据类型,如JSON。

万岁多模型数据库

当然NoSQL的标签的死亡确实NoSQL的模型并不意味着死亡。相反,它指向一个单一的数据库中使用多个数据模型。这是最近在一份概述网络直播由Matt阿斯莱特,研究数据平台总监和分析451研究,对物联网和多模型数据基础设施,他在其中指出:

  • 数据库市场已经占据了40年的关系数据库模型(和SQL) - 通常与运营和分析工作负载单独的数据库。
  • 新兴数据库利用内存中的和先进的加工性能,以提供合并的操作和分析处理。
  • 通晓数种持久性推动了数据库市场与NoSQL的扩张 - 专家数据库专科目的和多个数据模型。
  • 使用多个数据库,以支持一个单独的应用程序可以导致操作由驱动相互依赖的复杂性和灵活性。
  • 多模型通过支持多个数据模型能够通晓持久性的,而不操作复杂性的灵活性。

该演示展示柜多模式如何,多数据库支持SQL和NoSQL数据模型,尤其是JSON和键值的组合,以及其他工作负载。

010516 NoSQL的1

计算的隐性成本

因此,虽然NoSQL的以更低的成本答应规模和性能,NoSQL的部署实际上远远昂贵比最初想象的。让我们看看几个隐藏的成本区。

*增加了复杂性。如由451研究阿斯莱特引用,“使用多个数据库,以支持一个单独的应用程序可以导致操作复杂性。”

每一个新的数据存储增加了数据团队的财务和运营负担。有支持多个数据库,只有填补利基工作量会增加成本。

*缺乏分析的。通过放弃关系代数在SQL隐,NoSQL的店有一场艰苦的战斗,当涉及到分析。许多NoSQL的存储实现类似SQL的查询层如卡桑德拉查询语言(CQL)或N1QL为Couchbase。这些提供了一些分析功能,但它们是不一样的ANSI SQL和他们这些资格从数据存储与企业的工具,使用SQL本地连接。这种分歧可以在一个企业试图设计开放标准如SQL负权衡。

这次谈话,我与在同一时间我正在起草这篇文章最终用户代表NoSQL的分析窘境。

010516 NoSQL的2

*查询延迟。复杂的分析可以具有挑战性的NoSQL数据存储,所以很多企业都被迫预先计算的结果。丰富媒体发现,这是与HBase的情况,并在列出的内存计算大会在旧金山的挑战,他们的漫游指南构建数据科学平台介绍。这个批处理工作流程介绍了系统延迟和减少数据的商业价值。不要介意,面向工作流的手段,结果本质上是过时和不够格的,提供实时分析的机会,一个批次。

*硬件蔓延。虽然规模,特别是在一个集群节点的数量,可以是荣誉的象征,我们的目标不在于有多少节点可以部署,而在于如何少。更重要的是为每个节点交易的效率。当NoSQL的解决方案需要要加上附加的SQL层,或者预先计算必须完成的查询可以在运行之前,它增加了对硬件蔓延和成本。

*保护模式,整合工作负载。还有其他的选择,最近被Gartner称作为关系型数据库的“前卫”提供使用SQL的关系性质的解决方案,而且性能需要规模化,频繁地通过使用内存技术。许多这些前卫的数据库也很喜欢JSON并入有用于结构化和半结构化数据提供的数据模型。

今天的客户们发现,出现什么样的NoSQL的新型低成本的解决方案实际上是远远高于最初认为。幸运的是,这些挑战可以与提供所需的性能和执行都在一个单一的解决方案全面的SQL分析的能力的数据库来解决。

许多大数据行业参与者都指出,革命正在进行的方式获取公司和处理数据。但也许是气候由格温夏皮拉,大数据的显着代言人的最佳概括:

这鸣叫放入角度NoSQL运动。虽然出现了人们对未来的灵丹妙药该模式,较少的数据管理办法,现实已经大不一样,许多认识结构,模式和SQL的经过时间考验的价值。

加入对网络世界的社有个足球雷竞技app区Facebook的LinkedIn对那些顶级心态的话题发表评论。

版权所有©2016Raybet2

IT薪资调查:结果是