衡量数据的经济价值

数据的赢家是谁?数据保存在哪里?新数据的不同之处是什么?数据应该在什么时候保存、移动、删除或转换?数据应该如何评价?为什么数据比以前重要得多?

分析/检查/检查/查找/研究/数据/放大镜
思想库

今天,在数字经济中,数据有了新的和不断变化的用途。然而,最大的问题是,用数据取胜,在哪里这些数据是否被保存,什么使新数据不同,如果数据被保存、移动、删除或转换,如何应该有价值吗?为什么数据比以前更重要吗?

数据是任何公司都拥有的最重要的资产之一,但令人惊讶的是,我们并没有像对待传统的实物资产那样严格地理解和衡量数据的价值。此外,数据应该作为资产折旧吗?或者它像艺术一样欣赏。与直觉相反,答案都是肯定的。

为了衡量数据的价值,我们可以应用一些简单的经济原理。例如,我们从IT预测中得知,正在产生的数字数据量远远高于正在购买的数据存储量。

为什么会这样呢?简单地说:产生了一些数据,但没有存储。用一个简单的供求曲线就能解释其中的原因。(资料来源:IDC Digital Universe, Recode。)

“电源”曲线是存储容量。此容量可在各种价格提供,但存储容量的最低价格阈值。“需求”曲线是产生的数据。此数据创建了对存储容量的需求。只要数据的值超过存储和随时间访问它的成本,就存储数据。一个简单的等式来表示这是:

数据值(t) >= (Sc + Mc + Ac)/GB/yr *保留期

基本上数据值作为时间的函数必须大于网络,计算和存储基础架构(SC)的成本的总和,维护数据和基础设施(MC)的成本以及访问数据(AC)的成本。为了使云和非云IAA之间的正常化,所有措施每年单位。该成本也是时间的函数,通过数据的保留期测量。

当然,在现实生活中,这个等式并没有这么简单。存储和维护数据的成本取决于数据必须保存多长时间,是否必须对其进行保护和保护,等等。保存数据也会受到惩罚,因为安全违反的风险会增加,而且随着时间的推移,数据丢失或损坏的风险也会增加。

在等式的值方面,没有明确的数据值测量。由于在某种程度上使用或分析该数据,数据的价值实际上是业务价值的衡量标准。此外,保留的数据量之间存在相关性,数据是如何可接受的,并且其值。例如,如果使用数据取决于历史趋势,则具有更多数据使所有数据更有价值。例如,使用机器学习已经改变了较大数据集的值,因为大多数机器学习算法在具有大量数据的训练时工作得更好。

曲线下的区域表示创建但未存储的数据量,因为其值被认为低于保持其的成本。如果我们开始假设人们会保留他们产生的所有数字数据如果他们可以的话,那么我们想要消除曲线下的面积。为此,我们需要缩低存储和维护数据的成本或增加数据的值 - 或两者。

一旦我们接受了数据值应该被测量的前提,我们会用这个测量做什么?在基础设施方面,我建议我们将解决方案的重点放在最大化数据价值度量上,而不是更具体的基础设施度量,比如每GB价格、电力使用效率或每月交叉连接成本。这将推动基础设施解决方案在两个不同的方向上的创新:一方面是降低总体拥有成本,另一方面是增加数据价值的支持。这可能包括索引和搜索的特性,内置的分析界面,数据移动等等。

我认为企业需要开始应用他们自己的业务指标来为他们的数据建立价值。从历史上看,企业这样做主要是为了度量数据值随时间的变化,假设旧数据因为访问次数少而不那么有价值。这不再是一个有效的假设,而且对数据的访问不是对其价值最相关的度量,而是对数据的分析输出。这个博客的未来议题将更详细地讨论这些话题。

加入网络世界社区有个足球雷竞技app脸谱网LinkedIn对最重要的话题发表评论。

版权©2017Raybet2

工资调查:结果在