2.组织从数据湖转移到处理数据平台
从某种意义上说,2014年是数据湖(或数据中心)之年,这是一种基于对象的存储库,以原生格式存储原始数据——不管是结构化的、非结构化的还是半结构化的——直到可以使用为止。数据湖有很强的价值主张,因为它们代表了一种可伸缩的基础设施,具有经济吸引力(降低了每兆兆字节的成本),而且非常敏捷。
Schroeder说,数据湖将在2015年继续发展,能够为数据湖带来多个计算和执行引擎,以就地处理数据。这不仅提高了效率,而且还创建了单点治理和单点安全性。
(相关:从大数据中看大结果的c级高管]
他说:“2015年,数据湖将随着组织从批处理向实时处理转变,并将基于文件的Hadoop和数据库引擎集成到大型处理平台中。”换句话说,它不是关于数据湖中的大规模存储来支持更大的查询和报告;2015年的大趋势将是围绕实时事件和数据的持续访问和处理,以获得持续的意识并立即采取行动。”