微软准备一个新的大数据的SQL语言

U-SQL将使非结构化数据的SQL服务器部署。

  • 在Facebook上分享
  • 在Twitter上分享
  • 分享在LinkedIn
  • 在Reddit分享
  • 通过电子邮件分享
  • 印刷资源
微软大数据语言SQL server
思想库

刷新的是微软裁员的最后一位其非我发明的心态,拥抱新的行业标准,没有条件,就像Java 20年前。你看到它,而显然对Hadoop和大数据的支持。

今年早些时候,微软宣布了一个Hadoop文件相一致的数据存储Azure数据湖店,可以运行大型分析工作量。湖泊是一个新术语的数据大数据行业大规模数据存储,将在稍后的时间。虽然一些大数据是实时或即时处理,数据湖泊,“把它放到一边,我们会得到它。”

这湖是微软Azure描述数据如何存储。在一个博客t·K。”Ranga Rengarajan,微软公司副总裁数据平台,制定了Azure数据湖的三个部分,其中存储的三人。

单个存储库,允许用户捕获数据的大小,类型,或格式,而不需要改变应用程序的数据。数据可以安全地存储、共享和可以从HDFS-based处理和查询应用程序和工具。

Rengarajan还宣布Azure数据分析湖,一个Apache YARN-based服务旨在处理大型规模的大数据动态工作负载。Azure服务将基于U-SQL数据分析,一种语言,将“统一SQL的力量表达代码的好处,”正如Rengarajan所说。

U-SQL的可伸缩的分布式查询功能使您能够有效地分析数据的存储和跨SQL服务器在Azure, SQL Azure数据库和SQL Azure数据仓库。

最后,还有Azure HDInsight,完全Apache Hadoop集群管理服务和广泛的开源分析引擎,包括蜂巢,火花,HBase和风暴。微软宣布的一般可用性管理集群在Linux上具有行业领先的99.9%正常运行时间的SLA。

“Azure数据包括所有湖方便开发人员所需的能力,数据科学家,和分析师存储数据的大小,形状,和速度,和所有类型的处理和分析平台和语言,“Rengarajan写道。

主要项目经理迈克尔•一大数据在微软,微软的新解释语言和为什么它是Azure所需数据分析自己的湖博客。他指出,大数据分析需要处理任何类型的数据的能力,经常使用定制代码轻松地表达复杂,自营业务算法和有效地扩展到任意大小的数据,无需开发人员担心。

问题是SQL和程序语言是不同的动物,所以微软设计U-SQL从头开始作为一个进化的声明的SQL语言通过用户代码与本机可扩展性用c#编写的。

“这统一范式,结合结构化、非结构化和远程数据处理,结合声明性和自定义命令编码经验,并结合经验在扩展你的语言能力,”变化中写道。

U-SQL是建立在微软内部的经验范围和现有语言,如t - SQL ANSI SQL和蜂巢。它使用c#数据类型和c#表达式语言,这样你就可以无缝地编写c#谓词和表达式在SELECT语句和使用c#添加您的自定义逻辑。”

“简而言之,把U-SQL语言建立在这些现有的语言和经验应该方便你开始和足够强大的最难的问题,“变化中写道。

作为的一部分,微软宣布Azure数据湖为Visual Studio工具,提供一个集成开发环境,跨越了Azure湖线数据,和简化编写、调试和优化处理和分析在任何规模。

相关:

版权©2015 IDG通信公司。Raybet2

企业网络2022的10个最强大的公司