1:您将需要考虑大数据
大数据分析了从大型Web服务提供者如谷歌,雅虎和Twitter,这都需要充分利用用户生成的数据。为了保持竞争力,但企业将大数据分析和相关。
你可能是一个真正的小公司,有大量的数据。小型对冲基金可能tb的数据,乔说梅特兰,GigaOm研究主任大数据。在未来的几年中,广泛的行业,包括医疗保健、公共部门、零售、和制造——将所有财务效益分析更多的数据,麦肯锡咨询公司和公司预期在最近的一份报告中。
使用Hadoop的必然性和大数据实现,Eric Baldeschwieler说雅虎剥离公司Hortonworks首席技术官提供Hadoop分布。它是适用于一个巨大的各种各样的客户。收集和分析事务数据会给组织更多的洞察顾客的偏好。它可以用来更好的通知创建新产品和服务,并允许组织更快地解决出现的问题。
2号有用的数据可以来自任何地方(无处不在)
你可能不认为你有pb的数据价值分析,但你会,如果你不已经。大数据是收集数据,使用“掉在地板上,”Baldeschwieler说。
大数据可能是您的服务器的日志文件,例如。服务器跟踪检查的人到一个网站,以及他们访问的网页,当他们在那里。跟踪这些数据可以提供洞察你的客户正在寻找什么。虽然日志数据分析并不是什么新鲜事,但可以做到不令人眼花缭乱的新级别的粒度。
另一个来源的数据将传感器数据。多年以来,分析师们一直在说到物联网,廉价的传感器连接到互联网,提供连续的数据流,对他们的使用。他们可能来自汽车、桥梁、或苏打水的机器。“设备周围的真正价值是他们能够捕获数据,分析该信息,并推动业务效率,”达拉斯Microsoft Windows嵌入式总经理凯文说。
3号你需要大数据的新技术
当你设置一个大数据分析系统,最大的障碍将会找到合适的人才知道如何工作的工具分析数据,根据Forrester Research分析师James之前。
大数据依赖于可靠的数据建模。组织必须关注数据科学,之前说。他们必须雇用统计建模,文本挖掘专业人士,专注于情感分析的人。这可能不是相同的技能,今天分析师精通商业智能工具可能容易知道。
这样的人可能会供不应求。仅2018年,美国可能面临雷竞技比分短缺140000至190000人与深刻的分析能力以及150万年与技术经理和分析师使用大数据的分析做出有效的决定,麦肯锡公司估计。
另一个你需要的技能手是争论的能力所需要的大量的硬件存储和解析数据。管理100台服务器是一个完全不同的问题比处理10服务器,梅特兰指出。你可能需要雇佣一些超级计算机管理员从本地大学或研究实验室。
4号大数据不需要事先组织
cio们习惯于严格规划出所有的数据将进入一个企业数据仓库(仓库)可以松一口气了,大数据设置。这里的规则是,首先收集数据,然后担心以后你将如何使用它。
数据仓库,你需要制定数据模式之前,你可以躺在数据本身。“这基本上意味着你必须事先知道你在寻找什么,”杰克说诺里斯,MapR的营销副总裁。因此,“你压扁粒度的数据和失去一些,”他说。“后来,如果你改变了主意,或想做历史分析,你限制自己。”
“你可以使用大数据存储库倾倒,并运行它的分析基础上,并发现的关系之后,”诺里斯表示。许多组织可能不知道他们正在寻找在他们的数据采集,所以这种自由“是大问题,”他说。
5号大数据不仅是Hadoop
当人们谈论大数据,大多数时候他们指的Hadoop数据分析平台。Hadoop是一个热点项目,预算和人被分配给它,“在许多组织中,之前指出。然而,最终你可能会与其他软件。
最近法律研究巨型LexusNexus,没有擅长的大数据分析本身,开源的平台进行分析,HPCC系统。MarkLogic也为非结构化数据,装备自己的数据库MarkLogic服务器,大数据样式的工作。另一个工具是Splunk赢得青睐的搜索引擎,可用于搜索和分析由机器生成的数据,如从服务器的日志文件。“无论数据可以提取从你的日志,很有可能,Splunk可以帮助,”指出Curt莫纳什莫纳什大学的研究。