如何找到一份数据科学家的工作

对于传统的数据分析师来说,这是一个全新的领域,因为培训的重点在于深入的统计和计算机科学知识。

你到底是如何进入数据科学家大联盟的呢?事实证明,没有一条正确的道路。相反,这在很大程度上是大数据领域的一场争夺战。内幕(需要注册)

问问十几位首席信息官,“大数据”排在战略优先级的首位是什么,你会发现,排在首位或第二位的可能性非常大。他们会告诉你,最大的挑战之一是找到他们需要的人才来分析和从企业中不断增长的复杂数据中提取业务价值。他们说,他们需要的是优秀的数据科学家——而且数量很多。

麦肯锡全球研究所(McKinsey Global Institute)估计,到2018年,IT就业市场将缺少19万名数据科学家。这是该领域被引用频率最高的报告之一。

但如何才能成为这些炙手可热的大数据专家呢?是培训、认证还是两者兼而有之?对于传统的商业智能专家来说,这仅仅是职业生涯中合乎逻辑的下一个步骤吗?需要计算机科学学位吗?

事实证明,没有一个正确的答案,至少目前没有。相反,这在很大程度上是大数据领域的一场争夺战。

“大数据就像一场儿童足球比赛。每个人都在抢球,但没有人确切知道该怎么做。它为人们带来了巨大的竞争。百健艾迪(Biogen Idec)首席信息官格雷格•迈耶斯(Greg Meyers)在韦斯顿,质量。

“这是一个非常流畅的区域,”同意在北卡罗莱纳州立大学高等研究院的分析的执行董事迈克尔·拉帕。“根据什么行业你在或者什么公司,你说话,这是一个不同的现实,当你谈论大数据”。

虽然单一的定义可能难以捉摸,但学术、职业和商业专家一致认为,所有数据科学家都需要完成某些基本任务,并需要掌握某些技能才能出色地完成这些任务。该学科的主要支柱是数据聚类、数据关联、数据分类和异常检测。

或者,正如数据科学家、预测安全分析提供商Red Lambda的首席技术官罗布•伯德(Rob Bird)所说,“你让数据变得更简单,找到关系,找到奇怪的东西,然后做出预测。”

科技术语表

数据科学与商业智能:有什么区别?

“数据科学”和“商业智能”这两个术语似乎经常与大数据联系在一起,但它们实际上是非常不同的学科。专家说,数据科学是关于预测未来的,而商业智能是关于生成静态报告的。

“传统BI工程师有效地上报信息是,即使他们报告的趋势和标准偏差为常态了,”安德鲁·登普西,Netflix的DVD BI主管和分析说。“他们是不是真的发现了新的信息金块,该数据是它是什么。”

但随着数据的科学,有一种神秘的元素。例如,Netflix的外观历史数据“以确定为什么有人或多或少可能是因为他们的行为翻腾,”登普西说。“有更多的不确定性存在,因为在总体水平上,很多人都可能有类似的收视习惯,但在个人层面,每个人都是不同的。”

这两个学科之间的另一个关键区别与数据本身有关。

首先,有大量的数据。Biogen Idec首席信息官格雷格•迈耶斯(Greg Meyers)表示:“有了这么多数据,你需要吸收这些数据,以便研究例外情况,而不是研究报告。”他说,制药商在整个生产过程中不断检查信号中的数据,以检测何时事件超出了容忍水平。当检测到异常时,将触发一个不同的操作过程。迈耶斯表示:“关键是要确保我们的生产过程尽可能受到控制。”“我们通过观察不同批次的数据,完善了我们的分析过程,因此我们关注趋势,以减少某些事情的可变性。”

另一个挑战是应对大数据的可变性。

乔希·威廉姆斯,在一个Kontagent的数据科学家指出,“在传统的BI系统,你通常有高度结构化的数据 - 之类的客户档案,您可以通过相关的数据,并在其上运行回归想出了一个分析。”

相比之下,在今天的大数据环境中,“你有一大堆复杂的数据,你不知道你可能看到的特征——输入因素——与输出有什么关系,”威廉姆斯说。结果是,数据科学“更具探索性”。搬起石头砸自己的脚更容易。你必须更加严格。做分析要困难得多,这就是为什么有那么多关于机器学习的研究,”他补充道。

-朱莉娅·金

大学加强

执行这些任务所需的技能跨越了传统的学科,包括统计学、数学和计算机科学。这就是为什么包括纽约大学(New York University)和北卡罗来纳州立大学(NC State)在内的几所学校提供专业数据科学家认证和学位课程的原因。

“数据过去是你收集的东西。它有整齐的行和列,”Rappa解释道。“你做的实验既耗时、费力又昂贵,而且你没有很多数据,所以你要处理样本大小。”

相比之下,数据流从你的每个接触点流出与员工、合作伙伴和客户打交道。“大数据就是把所有这些数据放在一起,用它来优化业务或库存水平,或更好地瞄准客户。这就是整件事的诀窍。你需要擅长处理大量数据的人,需要有数学和统计学知识的人来分析数据。”

早在2005年,NC州立大学就认识到这一点,创建了高级分析研究所,该研究所汇集了来自不同学科的教员,“以一种非常综合的方式”教授数据科学,Rappa说。学生们学习统计、金融和商业方面的技术课程,学习沟通和团队合作技能,拉帕表示,就雇主而言,“这些技能几乎总是胜过技术技能”。

他表示,团队合作技能至关重要,因为“你不可能把你需要的所有(数据科学家)技能都集中在一个人身上。”(See "跟踪难以捉摸的数据科学家“。)相反,数据科学家通常在团队中的工作。以IBM为例,混合与卓越的数据分析中心,帮助商人确定是什么问题,他们需要的数据来回答。该中心的目标是产生通过收入的MBA统计学家商业头脑和分析的婚姻,说CIO珍妮特Horan的。一个项目在IBM工作时,产生的领土有10%的性能改进,其中,被应用模型中的170个国家的优化销售覆盖。

密集北卡罗来纳州计划,该计划的学生参加了一整天,每周5天,10月以来,奖项毕业生科学硕士学位。而不是在完成最后的论文,学生团队合作完成实习项目与主要公司,包括通用电气公司和葛兰素史克公司的实时数据。该计划的学生的百分之七十来自于员工,其中许多赞助他们的雇主。大多数学生至少有两年的在职经验,他们的平均年龄为29门课程花去了北卡罗莱纳州的居民$ 21,000和其他人$ 36,000。

在纽约大学,新开设的两年制数据科学硕士学位也是多学科交叉的,涉及数学、计算机科学和统计学。这是因为,要想做好数据科学,“你需要在这三方面都有专长,”该大学数据科学中心(Center for data science)的常务董事罗伊·洛兰斯(Roy Lowrance)说。

洛伦斯强调,数据科学家们还需要他所谓的“应用知识。”没有它,“你不知道什么工作和试验,特别是在商业,直觉”他解释说。

洛伦斯是指为应用知识是什么,其他一些专家形容为领域的专业知识。但是,不管你怎么称呼它,都认为它是在商业世界的数据科学家绝对必要的。

因为数据科学家们指控最终显示业务价值,了解特定的业务至关重要”,因为有很多细微的在每一个领域,“Josh Williams说,数据科学家Kontagent,公司发现并识别客户行为的见解从社会、移动和网络实时数据。

“数据科学家是熟悉统计和经典数学分析的人,他们需要在编程和计算机科学方面有很强的背景,或者至少有用编程语言完成工作的能力,”Williams说。“但他们也需要在如何将不同的自动分析算法应用于特定领域方面的专业知识。”

不过,他补充说,“数据科学技能不一定产业转让的”,因为容量和数据的复杂变化因行业。“我们正在处理的订单数量级更大的体积,但真正重要的是,数据更加丰富和复杂,”威廉姆斯说。

培训方案

获得领域专业知识的最佳场所是在工作中。但对于那些对提高技术技能感兴趣的人来说,除了大学课程之外,还有其他选择。

“网上有很多好的数学和统计课程,也有很多计算机科学课程,”纽约大学的Lowrance说。此外,大数据市场的供应商,如Cloudera,正在为未来的大数据专业人士开发广泛的培训项目。

Cloudera提供教师指导的课堂和在线培训。培训按专业角色(如开发人员和分析人员)和应用程序划分。例如,学生们可以学习在Cloudera的大数据平台上开发推荐系统的课程。

一个Cloudera的最受欢迎的课程是面向开发人员,主要是使用Java的。“他们可能会写MapReduce应用,采取网络日志,这是非常经常使用,因为现在它可以存储和分析,”莎拉Sproehnle,在Cloudera的教育服务副总裁。“[然后他们会]做一个简单的分析,或许计数的次数不同的IP地址访问他们的网页。从那里,他们可以扩展到形成一个地理查询,看看他们的地域网络活动的来源。“

Cloudera报告称,2012年,它培训了1.5万名开发人员,并在全球各地每周提供新课程。

“我们旨在为观众尚未自称数据科学家”,Sproehnle说。“他们可能是软件工程师,统计人员,他们需要配备什么才能在这个新的大数据驱动的环境[操作]”。

她说,培训的确只关注Cloudera的大数据平台,但也涵盖了更基本的大数据概念,如机器学习、分类和集群。

该公司还提供了一个认证,这Sproehnle说:“开始出现在LinkedIn个人资料和工作描述正在招募大数据专业人士。”

她补充道:“在如此年轻和新颖的技术领域,认证“提供了一种程度的舒适感,(申请者)所能提供的,远比他们只读几页书所能提供的更多。”

了解更多关于管理在计算机世界的管理主题中心。

这个故事,“如何捉拿数据科学家的工作”最初发表计算机世界

加入对网络世界的社有个足球雷竞技app区脸谱网LinkedIn对最重要的话题发表评论。

版权©2013Raybet2

IT薪资调查:结果在