数据囤积是不是一个可行的策略了

随着组织收集的数据量持续增长,简单地存储所有数据是没有成本效益的。平衡数据减少和保真度的策略越来越重要。

Sashkinw /盖蒂图片社

多年来,它一直是正常的做法组织尽可能多的数据,因为他们可以存储。更经济的存储选项周围大数据的炒作合并鼓励囤积的数据与想法,价值将在未来的某一时刻被提取。

随着数据分析的进步现在很多企业都成功挖掘他们的数据有用的业务洞察力,但所生产数据的绝对数量和需要进行分析准备它是黄金的理由重新考虑你的策略。为了平衡成本和价值它超越数据囤积,并找到处理,从而减少数据你收集的方式是很重要的。

指数数据增长

每天产生的数据量正在快速增长。人们生成了大量的数据,但机器生成的数据将使这些数据黯然失色。据估计,物联网将从今年的230亿部联网设备发展到2020年的近310亿部,到2025年将达到惊人的750亿部在Statista IHS数据,收集和储存所有的原始数据开始看起来不切实际。

我们已经跟上数据生成至今采用更好的压缩技术,重点是什么改变了增量备份,但随着成交量的增加,我们要落在后面远远。我们必须找到一种方法来减少数据的,我们正在收集量。

确定你需要什么

存储数据最昂贵的方式是原始数据,因此我们需要减少数据,提取相关的细节,比如平均值或标准偏差。简化我们收集的数据并对其进行处理,以确保它是一种有用的格式,这似乎是一个显而易见的答案,但是,这并不像听起来那么容易。

在某些情况下,可以谨慎地保存在责任风险的情况下,对未来审计的原始数据。法规要求,还必须决定什么样的数据,以保持和什么放手时称重。

简化数据的部分困难在于,我们仍在通过机器学习和人工智能开发分析。这意味着我们在赌什么是有价值的,什么是我们可以放弃的。尝试并存储所有原始数据既不实际也不明智,但是可以找到一个平衡点,这在很大程度上取决于您的具体业务。

处理在边缘

弄清楚你想要什么样的数据,以保持和你正在收集应处理剩余的数据是如何只有一个一块拼图。您还需要在哪里工作的处理和数据压缩会发生。有想集中分析数据,但收集数据并将其发送到云的处理是要花费时间和金钱成本的自然倾向。

在许多情况下,这将证明更具成本效益的边缘,以减少数据,尽可能接近到它产生的地方。这仅是通过发送向前您所需要的分析减少存储需求和网络流量的好方法。诀窍在于找准你所需要的,但机器学习的进步,我们将能够超越教育的猜测进步。

映射未来

为了降低丢失有价值数据的风险,您需要制定一些预测,并就企业的未来提出探索性的问题。不要只看你今天使用的数据,问问你明天可能会用它做什么。如果有新的来源,找出他们需要什么来提供有效的业务分析。

必须有某种ROI计算的在这里。什么是存储这些数据相对于它的潜在未来价值的成本是多少?你的理想的拓扑结构和计划工作,你将如何减少数据,转发,存储,处理它,分析它。

在短期内,可能有必要宁可谨慎的,并作出规定侧面来存储更多的数据点。最好的策略,现在可能是过程中,在那里边就可以了,但结合起来,与那里的围绕其价值更清晰可读数据的更传统的中央集权。

积极主动

随着数据量越来越大,不采取行动就是自找麻烦。你需要一个智能云数据管理策略来推动创新,它将依赖于你建立的数据收集和处理基础。新数据积累的速度和预计的增长速度意味着,时间是至关重要的。尝试改进一个处理过程或引入一个精简的数据拓扑结构永远不会像今天这样容易。

使用当前的经营业绩和未来的目标,以确定你所需要的数据,想方设法在那里边实践来处理这些数据,并权衡分析与存储的值。理想的数据战略将需要时间搞清楚,并从不同组织的组织,但什么是可以确定的是,数据囤积不再是一个可行的办法。

加入对网络世界的社有个足球雷竞技app区Facebook的LinkedIn对那些顶级心态的话题发表评论。

版权所有©2018Raybet2

IT薪资调查:结果是