失败的预期,增加的成本,不必要的法律风险——盲目进入大数据项目是不值得的
“大数据”已经成为一项重大的商业举措。但是,混合数据流以揭示大胆发现的时髦的、实验性的、特别的表面,掩盖了一项庞大的文化和技术事业,并不是每个组织都准备好了。
如果没有一个战略计划,包括连贯的目标、强有力的数据治理、确保数据准确性的严格流程,以及正确的心态和人员,大数据计划很容易最终成为一项重大的负债,而不是宝贵的资产。
InfoWorld的Andrew Lampitt在他的新博客中超越了炒作,审视了工作中的大数据认为大数据.|下载信息世界的大数据分析深度潜水为一个全面的,实际的概述。]
以下是避免大数据失败的5个战略建议。在许多情况下,建议适用于任何数据管理项目,而与数据集的大小无关。但是,海量数据存储的出现也带来了一系列特殊的缺陷。下面介绍如何提高组织混合来自不同来源的大型数据池的成功几率。
大数据成功秘诀1:让大数据成为核心商业原则Rearden Commerce首席技术官Phil Steitz简明扼要地总结了大数据成功的最重要驱动力:你必须将分析和数据驱动决策整合到商业战略的核心。
Steitz说:“如果‘大数据’只是公司内部的一个流行词,它就会成为寻找问题的解决方案。”
里尔登商务(Reardon Commerce)的电子商务平台利用大数据和其他资源,优化买卖双方之间的商品、服务和信息交换,“绝对相关性”的概念——在正确的时间将正确的商业机会摆在正确的经济主体面前——是关键。
Steitz说:“这是这种思维的一个例子,它起源于房子的顶部,并集中驱动策略。”
Steitz说,这种方法的一部分包括建立一个由数据科学家、语义分析师和大数据工程师组成的小型、高效的团队,然后在这个团队和业务中具有前瞻性的决策者之间建立一个持续的、双向的对话。
“真正从当代分析和语义分析技术中获取价值的最大挑战是,真正能够提出可能的东西的技术专家需要与‘了解它’并帮助筛选出真正有价值的商业领袖深入接触,”Steitz说。
让大数据成为整体业务战略一部分的另一个关键成功因素是有效管理数据合作伙伴。
Steitz说:“在当今世界,要真正优化客户体验和经济价值,不可避免地需要跨企业共享数据。”“NaA-ve的做法——‘只要每晚把完整的交易文件发给我们就行了’——由于操作、隐私和安全原因,遭遇了悲惨的失败。”
大数据成功秘诀之二:数据治理至关重要大数据项目带来了这些对安全,隐私的担忧,以及法规遵从性。在医疗行业,这是一个最敏感的问题。
医疗服务提供商贝斯以色列女执事医疗中心(Beth Israel Deaconess Medical Center)是一个越来越多地参与大数据的组织电子医疗记录,新的医疗报销模式,以及多年来收集的大量临床和索赔数据。数据治理将发挥关键作用。
Beth Israel Deaconess的首席信息官Bill Gillis表示:“医疗IT组织将面临巨大的压力,需要迅速扭转数据。”
有了强有力的治理,组织就可以确保数据是准确的,并告诉他们所需的临床情况,以便提供高质量和更好的护理。
吉利斯说:“关键是不能让‘紧急暴政’占上风。”“提前做好治理可以帮助避免这个陷阱,并保持事情在正轨上。”
当然,安全和隐私是其中很重要的一部分。
Venture Development Center董事长兼首席执行官Charles Stryker表示:“考虑到围绕新大数据的不确定性,对于重要品牌来说,隐私和安全标准是如此之高,因此对这些新数据的保护高于大多数传统的外部决策数据。”这家咨询公司为美国在线、思科、First data和雅虎等公司提供大数据咨询。史崔克说:“没有哪个大品牌愿意测试隐私和安全底线的极限。”
从项目的开始,公司需要考虑数据来源(元数据描述的源数据)和做出适当的血统决定(信心数据)在使用这些数据在任何大数据解决方案,路易证据说,高级技术顾问和大数据技术和管理咨询公司刚果民主共和国,它帮助政府机构实施了大数据项目。
夏博说:“维护数据来源元数据和基于血统的决策不是你在事后‘强加’的事情。”“这是倡议不可分割的一部分,必须从一开始就设计和纳入。”Chabot说,在适当的时候,应该使用专门的技术,如数字签名,来保护出处免受意外和/或恶意篡改。
企业还需要尊重数据隐私法律法规。Chabot说,“可以使用各种技术,如数据的匿名化、剥离数据元素和限制数据的分发和使用”,以便组织遵守安全和隐私法规。
大数据成功秘诀之三:不要低估数据的准确性阿伯丁集团(Aberdeen Group)最近的研究强调了大数据成功的另一个试金石:数据准确性。
根据该报告,一流的公司(由Aberdeen指标确定)报告称,94%的数据准确性是他们的组织目标,需要1%的改进才能达到这个目标。但行业平均水平的公司报告的数据精度目标为91%,需要在数据管理方法上提高18%才能实现这一目标,而“落后”公司报告的数据精度目标为80%,需要在当前性能上提高40%才能实现这一目标。
在这里,数据清理和掌握是大数据成功的关键。数据管理和大数据咨询公司Caserta Concepts的创始人兼首席执行官乔•卡塞塔表示:“与某些信念相反,这一要求并没有消失。”“如果大数据范式要成为新的企业分析平台,它必须能够将客户、产品、员工、地点等联系起来,而不管数据源是什么。”
此外,他说,已知的数据质量问题长期以来危及数据分析的可信性,如果不加以适当处理,也会对大数据分析产生同样的影响。
DRC的Chabot指出,在一个典型的大数据项目中,数据管理往往被开发人员“忽视”,可能无法解决。他说,有效的数据管理包括确保采用成熟的技术(流程和自动化)来处理模型管理、元数据管理、参考数据管理、主数据管理、词汇管理、数据质量管理和数据库存管理。
大数据成功秘诀4:汇集最佳实践,获得最佳结果在管理大数据和分析方面,人们正在发现什么有效,什么无效。当他们受雇于同一个组织时,为什么不分享这些知识呢?
实现这一目标的一种方法是创建一个大数据COE(卓越中心),这是一个提供领导力、最佳实践以及在某些情况下提供支持和培训的共享实体。
通常情况下,coe有专门的预算,并被设计用于分析问题;定义计划、未来状态和标准;培训用户;专注于大数据和分析程序的咨询公司Massive Data Insight的联合创始人艾略特·阿诺德(Eliot Arnold)表示,要执行计划并保持进展。他说,启动COE需要对可用资源和高级执行发起人进行审计。
刚果民主共和国的Chabot说,虽然大数据COE在理论上是一个好主意,但它的有效性将取决于它在实践中的实施情况。
Chabot说,覆盖整个数据生命周期的COE存在许多基本挑战,包括编写和确定最佳实践;以公正的方式审查他们;正确记录它们的适用性;监督他们的采用;并随着时间的推移使它们现代化。
DRC定义了一个大数据成熟度级别,类似于组织使用的流程改进框架CMMI(能力成熟度模型集成)。大数据成熟度级别模型描绘出相关的最佳实践。它们分为四组:计划/管理、项目执行、体系结构和部署/运行时/执行,以便组织随着时间的推移逐渐采用。夏博说,这避免了试图快速变得过于复杂的陷阱。
大数据成功秘诀5:专业知识和协作是关键大数据是一项商业倡议,而不仅仅是一项技术项目,因此业务和it领导人在计划、执行和维护方面保持一致是至关重要的。
阿诺德说:“对于一个项目来说,最大的缺陷之一是IT和业务之间在谁控制战略和计划上的脱节。”“在不太成熟的组织中,没有文档化的战略,工具大杂烩在生产中,决策者喜欢用直觉来绘制战略方向。这类公司大多不知道数据的资产价值。”
商业领袖和IT专业人士可以通过仔细确定目标、需求和要求来确保他们的大数据项目成功;计算投资回报;将分析能力与业务/任务需求相结合;DRC的Chabot说,并安装一个持续反馈机制。他说:“大数据项目应该分成多个阶段,逐步为企业增加价值。”
但是,让IT和业务领导人达成一致,以及让各部门在数据计划上合作,并不总是那么容易。
“根据我的经验,对于大公司来说,这正成为一个真正的企业挑战,”风投发展中心的Stryker说。“与首席数据官相关的工作职责是属于IT部门、营销部门、风险管理部门,还是每个部门都有自己的大数据计划,并相互协调?”
企业还需要引进必要的专业技术来开发Hadoop等大数据技术。Hadoop已实现了对超大数据集和分析任务的低成本、计算效率高的管理。
“向大数据的范式转变在企业组织中引入了一个新角色——数据科学家,”卡塞塔说。“这个职位需要对高等数学、系统工程、数据工程和(商业)专业知识有深刻的理解。”他说,在实践中,使用数据科学团队是很常见的,统计学家、技术专家和商业主题专家共同解决问题并提供解决方案。
卡塞塔说,许多已经从事数据分析工作的人需要为文化冲击做好准备。
他说:“在启动大数据项目之前,应该进行战略准备测试,以评估新范式的采用情况。”业务分析师将需要重新培训或调整用途。转向大数据平台的目标可能包括从反应性分析(例如,一个活动的效果如何)转变为预测性分析(下一个活动将提供什么),他说,“因为现在我们可以主动影响非购买者,让他们遵循忠诚客户的行为模式;或者,当活跃客户的行为模式开始变得像流失的客户时,重新刺激他们。”
如果不建立一个强大的、有凝聚力的大数据战略,会有什么风险?进行昂贵的努力却未能兑现承诺。
夏博表示:“大数据项目通常是多维度和复杂的项目。“它们需要大量的前期规划。”他说,在着手大数据项目之前,组织领导人应该确保战略、功能、数据、分析和技术路线图之间的一致性。这些路线图需要反映在业务、系统、软件、数据和技术架构中。
“这些路线图之间的任何一个不一致都可能导致整个项目脱轨,”夏博说。“如果没有一个强大的、具有凝聚力的大数据战略,以及适当的路线图和架构,可能会导致成本过高、预期不匹配、价值缺乏,最终导致程序失败。”
相关文章
- NoSQL摊牌:MongoDB vs. Couchbase
- 信息世界大数据分析深度潜水
- InfoWorld Hadoop Deep Dive
- 如何在大数据领域找到一份热门工作
- 7个驯服大数据的顶级工具
- 企业Hadoop:更容易处理大数据
这个故事,”避免大数据崩盘的5个策略建议,最初发表于InfoWorld.com.跟踪最新的发展大数据在InfoWorld.com上。有关商业技术新闻的最新发展,请跟随在Twitter上InfoWorld.com.
阅读更多关于商业智能的信息在InfoWorld的商业智能频道。
这篇文章,“避免大数据崩溃的5个策略贴士”,最初发表于信息世界 .