美洲

  • 雷竞技比分
执行编辑报

Databricks使用Spark谷歌流分析

新闻发布
军元30,2014 3分钟
云计算 数据挖掘 企业应用

数据bricks计划提供自己的云服务分析直播数据流,

Databricks云设计提供平台分析流数据,类似于GoogleDataFlow服务上星期宣布.

同GoogleDataFlow一样,Databricks云保证提供单程序设计模型,跨度数据分析的不同方法,包括支持批量编程和直播数据流和GoogleDataFlow一样,Databricks云优先提供预览模式,全商业支持到年底到期

这两大服务面向不同的市场,据DatabricksCEOIONStoica表示

GoogleDataFlow真正面向开发者数据科学家和数据工程师高层次接口,Stoica说

Databricks还保证应用可移植性整栈都基于开源软件, 用户可以按需转包到其他Apachespark装置Stowica说, “你可以用应用程序运行到另一个云中”。

企业可使用这种服务执行任务,如批量分析可确定客户停止使用产品的原因或检测欺诈活动,在恶意活动仍在发生时可发现恶意活动

加利福尼亚大学伯克利分校AMP(算法机和人)实验室原创Spark为统一处理引擎,它能为各种数据分析任务提供平台,包括交互查询、蒸汽数据分析、机器学习和图计算

数位开发者支持Spark继续组成Databricks软件本身设计在一个服务器集群上运行,现在管理成开源工程受Apache软件基金会指导

提供spark服务消除了建立并维护Spark内部执行的艰巨任务Stoica指出

Clusters很难建立并维护搭建数据管道需要叠多工具,工具仍然难以使用取值数据仍然是一场争斗,

数据bricks云端初始运行亚马逊Webservice,尽管最终它也将运行于Google等其他云提供商

除spark平台本身外,Databricks将提供一套内置应用程序,可完成常用数据分析任务用户可建立自己的工作流或发布查询并直接与数据交互输出可管道到仪表板或报表

Databricks并非唯一使用Spark能力的公司清除故事出价Spark分析软件包允许组织汇总数十个非结构化数据源分析,

Databricks周一还宣布它已收到3 300万分数B供资,由风险资本公司新企业联想牵头,由AndreessenHowowitz后续投资