多执行官和组织视大数据为灵丹妙药,但数据分析无法解决你面临的所有问题这三个假想特别说明对大数据能做什么的常见错误概念
大数据肯定所有愤怒华尔街日报最近写到数据科学家每年指令达300 000美元,经验微乎其微很显然接受大数据时代就在这里
然而,既然这个领域工具和最佳做法如此新奇,重要的是重新审视我们对大数据能为我们做什么 — — 更重要的是它不能做什么 — — 的假设。三种常用错误假设 大数据能为你和你的业务做点什么
大数据无法预测未来
大数据-所有分析工具、评论、科学实验和可视化-无法告诉你未来会发生什么为什么你收集的数据完全来自过去时间点尚无法收集未来数据点和值
我们可以分析过去发生的事情 并尝试画出动作与决策点 及其结果之间的趋势 基于数据, 我们用它猜想但我们无法预测未来
[更多:5世界问题大于大数据并大数据无良好分析引导错误决策万事通
多执行官和组织试图从大数数据中挖掘未来这是一个坏主意,因为未来总是变化金融顾问常使用线, 即Past性能无法保证未来结果吗?
避免预测未来,使用大数据优化并增强当前真实性并建设性地提高当前事件结果数据查找正确问题查询切勿使用大数据水晶球
大数据无法替换您的值-或您的公司值
大数据低值替代值 — — 即你赖以生活和公司努力运营的素养和标准实质问题选择可能比较精细化,整理各种动作的利弊可能比较容易清晰,但数据本身无法帮助你解释某些决策如何与你为自己和公司制定的标准相容。
数据可以绘画各种图片, 包括数字本身 和辅助可视化软件员工可生成许多预测问题,但这些结果很简单-投影身为执行官兼首席信息官 提供各种工具 员工在企业内使用 即实际调和数据 与公司值
[别忘记CIOs推大数据项目但优先隐私自定义大数据安全隐私问题未解答万事通
比方说 假设你是一个汽车制造商大数据源和工具告诉你,某些车辆模型有缺陷,修复尚待制造的车辆可能需要几美分,但修复已由客户购买并正在生产中的车辆的成本要高得多。数据 和您的数据科学家 员工, 可能建议修补问题 汽车仍在装线上 但不烦扰修复汽车
注意,如果你一直跟踪此场景 听似熟悉通用汽车点火交换机.并没有任何证据大数据插进GM回想中
如前所述,数据可以向您提供更多更好的选择,也许可以说明每一种选择可能发生什么。数据有时完全不值一提-即个人使用时
为什么几乎不可能量化个人行为人有自己的环境集 自己的小宇宙集 自身的理由和背景单人应用数学是不可能的取而代之的是,你必须看一组个人,一组特征相似的主体唯有到那时你才能观察行为趋势 适用于全组
这并不是大数据问题统计问题最容易举的例子就是信用评分,它意图拆分消费者群并分析每个集团个人总还贷历史
人有720信用评分,那分实际上意味着他们的还本付息历史将他们归为类统计组--X%(取决于具体信用评分和信用评分的哪个变异值,你来判断个人群中人的实际百分比-换句话说,一定百分比的借款者在该范围中得分)要么严重违约,要么实际输入默认值
信用评分不说明个人他或她下个月可能违约,或从未实际违约,或严重失职并恢复到某些时间线上统计毫无线索并因此无预测能力
[案例研究:monsanto近十亿大数据分析万事通
信用分数无法预测个体行为拥有805信用评分的借款人可能准备战略违约并永不再借一分钱,而拥有590信用评分的借款人可能与医生有争议帐单而无其他债务这种现象说明为什么一些金融机构不根据风险来计息贷款取而代之的是,这些机构彻底承保借款人,像第一个信用评分首发前那样,当他或她请求资金时。分析个人状况比基于大量数据得分多得多地显示其偿还能力或意愿
人难解人类无法预测不可错误思维数据预测大数据人混为一谈