跨栏Hadoop的

该供应商编写的技术底漆已经被网络世界编辑,以消除产品推广,但读者应该注意到它可能会倾向于提交者的做法。有个足球雷竞技app

大数据“是一天当中的流行语,并学习如何管理它和提取价值来自它是各行业的高管首要考虑。一个因素在大数据的激增是在当前的企业数据管理理念的转变。

此前,公司仅收集,这是必要的,以一问一答的具体问题的数据。如今,企业的心态,所有的数据应保持下运作,无论来自何方,因为你永远不知道什么时候会需要它的问题会出现什么。数据hording这种趋势在价格计算机硬件及网络设备,这也使公司能够保持到更多,以更实惠的价格大幅下降的推动。

图辑:“人脸大数据”

如何:获得认证的Hadoop快...

那么,如何一个公司开始应对这种非凡的数据?Hadoop的。建筑师道格切割,谁命名Hadoop的儿子的黄色玩具大象后,创建在Apache许可证下这个软件框架。简单地说,它是开源软件,旨在允许企业存储和处理大量的数据。

而且,在571个新网站的创建,产生超过10万个微博和超过200万个谷歌查询是做成世界在一天的每一分钟,大数据管理势在必行。Hadoop的地址这一需求,为公司提供存储大量需要应对业务的关注数据的能力,是有意义的。

Hadoop的设计为计算机集群上运行,从而能够使用商用硬件和分发跨机器的工作,以实现大规模可扩展性。这种分布式的本质是什么,很容易让Hadoop的处理和存储如此大量的数据 - 并使其廉价和易于扩展的需求增加。

大多数公司都使用自己的Hadoop系统作为数据炼油厂 - 以大量的数据,其加工成可管理的,更有意义的数据块,然后询问数据的问题收集有用的信息。一旦你有一个Hadoop集群,它的时间,通过启动处理MapReduce的,其中数据转换成相同的格式(元组),并且所有的重新格式化数据组合到更小的组可以更容易地消耗转换,进一步处理和分析。

Hadoop的缺点

不幸的是,就像生活中所有的事情,Hadoop是不完美的。其中一个主要问题的公司碰到的是他们目前的基础设施中采用的Hadoop。

例如,如何从他们的Hadoop炼油企业访问数据时,大多数开源驱动的编写没有完全ODBC规范的支持?如果没有对ODBC核心功能的全力支持,公司正处于一个困难时期调和他们使用Hadoop BI套件和被强迫从事专门的特殊项目来分析Hadoop的数据。这是因为Hadoop的目前最大的限制在于它不适合与数据分析和可视化工具的现有企业生态系统。

总之,企业不具备他们需要弥补这一差距连接并进行数据分析Hadoop的平台,其中介绍了必须组织之前克服巨大的障碍,才能真正全面显现的Hadoop提供的技术。

为了实现这一目标,企业需要快速,ODBC兼容的连接,他们可以用自己的BI套件使用。由于ODBC是首选的几乎所有主要的BI套件的标准,它的关键是解锁的Hadoop数据可视化和分析这些应用。Hadoop的开发驱动程序已经在作品中,有几个大牌供应商提供的工具和方法,采取降低数据并将其移到传统的仓库连接到的分析工具,目前居住那里的生态系统。

Hadoop的来临,这是脱胎于需要房子越来越多的数据,创造了一个全新的市场,用于连接和分析数据。这是一个尚未相对于Hadoop的全面要求,但拥有巨大潜力的领域。如何访问数据,并把它放置到一遇的分析工具读取的形式?这是公司在空间面临着和工作来回答这个问题。

但是,你需要寻找移动到Hadoop的风格数据炼油厂时要考虑的另一个“房间里的大象”:人才。一旦公司有连通性和他们的Hadoop集群集成到现有的业务应用程序,你需要的人才,才能使这一切的感觉。Hadoop集群设置101和MapReduce作业101不教如大多数主要大学的计算机科学课程的一部分。

更多:Hadoop的赢得了企业IT,马刺人才短缺

随着技术部门已经开始意识到这个缺乏人才,因此它们响应:通过繁殖数据科学家。这些科学家通常是计算机科学家和数学家的某种组合 - 与被视为“数据灵媒”,总是知道要问什么,以深入了解影响他们的公司决策的数据。

至于这些作业需求的增长,更注重在大学阶段将增加熟练程度在这方面,我们将看到在所有行业数据洞察的激增和创新。在此之前,简单地的Hadoop的完整利益无法实现。

Hadoop的商业价值

尽管它的不足之处,Hadoop的为商业价值提供了巨大的潜力。由于见解是从挖掘大数据的收集,更多的公司将寻求Hadoop的与现有的应用程序集成。事实上,不管你知不知道,Hadoop的可能已经触及你的日常生活了。

今年六月,一个文章华尔街日报通过报告Mac用户更倾向于花更多的钱在酒店房间比PC用户造成了巨大的轰动。鉴于此,Orbitz的搜索推Mac用户对高价位的房间。

这个数据是基于收集的关于Mac用户的行为信息巨型数据集(非结构化数据的750兆兆字节,根据Tnooz),是公司如何使用Hadoop来创建和存储非结构化数据的大型数据库,并通过数据炼油厂分析这些数据,使通过这些分析良好的商业决定一个很好的例子。

在这种情况下,Orbitz的代表,赢得它是否能够合适的酒店,卖给合适的客户进行积极的旅行体验。通过呈现高价酒店于Mac用户,谁是刻板的认为有更高的收入,它希望增加基于大量已收集和一段时间分析数据的业务。

在另一个例子中,雪佛龙公司利用大数据分析来获取更多的石油桶了其钻井生产的。传感器技术已经发展了很多有利勘探船能够得到洋底更高的分辨率扫描。

对于大石油大数据的最新机会编译和从所有不同的船只减少扫描数据,以获得最佳的地方的更完整的视图,开始钻探。数据科学家能够使用系统,Hadoop等来存储和迅速减少这些数据,这意味着雪佛龙和使用该技术的其他石油公司可以得到更多的石油桶流入市场迟早比以前可能。除了寻找新的油位,雪佛龙公司还分析从现有的石油平台得到最有效的和高效的生产采集的数据,节省了数百万美元的运营成本。

发展趋势

在我们向前深入大数据的世界,从大数据发展趋势的使用也影响Hadoop的。这些措施包括,以处理大量的信息从数据源,灵活运用多种功能的混合包在一个空间内,并将它们整合到一些管理的能力。

正如前面提到的,Hadoop的,允许公司捕捉所有可用的数据,并将其保存回答可能在未来水面的问题。当这些问题被确定,企业可以进而降低现有数据都问这些问题,并有效地回答他们。在空间中的大玩家正在推动的方法中,你可以把你的数据减少,将其移动到数据仓库和提出问题在那里。这将使您能够利用现有的数据仓库和所有的精炼数据从您的Hadoop系统存放在一个集中的地方,很容易接触到你的组织的成员。鉴于这种情况,很可能我们将看到周围的仓储现有的数据和这条管线格式分析基础架构Hadoop的配对趋势。

但Hadoop的未来超越数据仓库延伸。三个五世的大数据 - 数量,速度和品种 - 是去年的问题。三组五世的全部问题,我们一直在努力解决,但他们只对大数据的起点,而不是终点。

随着技术的发展,我们将继续看到快速普及,以及不同数据的配对会给我们的结论,我们从来没有想过可能。这将铺平道路,这三个我的大数据:智慧,洞察力和创新。

当我们建立更好的系统,这些系统本身它们所具有的智慧,机器学习将帮助我们关联看似无关的数据,以实现新的见解和结论,我们可以用它来对我们的业务,我们的生活和我们的地球做出更好的决策。然后,这些见解将导致更多的技术创新,将从头再来的过程。我们在大数据时代的初期,而未来是光明的确实。

那么,这给我们?Hadoop的,以其目前的形式,提供了巨大的希望,但是仍然缺乏来自于它的潜力完全交付妨碍它的几个组件。承诺是一个框架,允许企业不仅存储大量的数据,但对其进行处理,获得它,分析它,都以低廉的价格。一旦更有效的连接可用,并已采取措施,以减轻人才短缺,难以预料企业将如何使用这个黄色大象做出更明智的业务决策。

杰西·戴维斯的研究和发展进步的DataDirect主任。

加入对网络世界的社有个足球雷竞技app区Facebook的LinkedIn对那些顶级心态的话题发表评论。

版权所有©2012Raybet2

IT薪资调查:结果是