为什么是数据科学家“感觉就像是一个魔术师”

三个工作数据,科学家们描述一下自己的工作就像

数据科学家的角色于今年年初推到了风头,当它被命名为2016吨的“最热门的职位从那以后,这个职位引起了人们相当大的兴趣。就在最近,白宫专门挑选了数据科学家上诉求助。

那些在工作中可以期望获得大约116840 $平均基本工资 - 如果他们有需要什么。但是成为一名数据科学家是什么样的呢?请继续往下读,听听目前在前线工作的三个人是怎么说的。

如何日期细分

数据科学家花费大量时间与数据打交道,这是毋庸置疑的。可能不那么明显的是,会议和面对面的时间也是一个重要的组成部分。

“通常情况下,新的一天开始的会议,”乔治TANU,客户经理和数据科学家LatentView分析说。这些会议可以作为各种目的的,她说,包括识别客户的业务问题,跟踪进度和讨论报告。

TANU乔治latentview LatentView Analytics(分析)

TANU乔治是LatentView分析数据科学家。

通过早盘会议平静下来,她说。“这是当我们开始捣弄数字”一般集中在试图回答的问题问前面的会议。

下午常常花在旨在对数字的理解,然后在一天结束的时候通过电子邮件共享分析和结果协作会议。

她估计,乔治大约有50%的时间花在开会上,另外20%的时间花在计算工作上,30%的时间花在口译工作上,包括将数据可视化和转化为可操作的形式。

与客户的会议还代表日瑞安罗萨里奥的显著部分,一个独立的数据科学家在线教育网站Springboard的导师。“客户会解释问题,以及他们希望看到什么样的结果,”他说。

接下来是都需要什么类型的数据进行了讨论。“更多倍不中,客户端却没有数据或者知道从哪里得到它,”罗萨里奥说。“我帮助制定如何得到它的计划。”

瑞安罗萨里奥数据科学家 瑞安罗萨里奥

瑞安罗萨里奥是一个独立的数据的科学家和工程师。

专注于医疗保健领域的MedeAnalytics预测分析科学家维吉尼亚·朗(Virginia Long)表示,很多数据科学并不是在研究数据本身,而是更多地试图理解“这对公司或客户意味着什么”的大局。“第一步是了解这个领域——我会花很多时间搜索文献、阅读,并试图理解问题。”

Long说,要弄清楚接下来谁拥有什么样的数据。“有时这是一个挑战,”她说。“人们真的很喜欢使用数据来为他们的决定提供信息的想法,但有时他们只是没有正确的数据来做到这一点。有时候,找出收集正确数据的方法是我工作的一部分。”

一旦数据在手,“挖”和理解说到未来。“这是基本的背景研究的另一面,”龙永图说。“你真的找到了什么数据实际上是,这可能是乏味的,但有时你会发现,你可能没有注意到,否则事情。”

弗吉尼亚长medeanalytics 弗吉尼亚龙

Virginia Long是MedeAnalytics的预测分析科学家。

龙也花了她的一些时间,内部和外部使用的创造教育材料,通常解释数据的科学技术如何各项工作。

“尤其是所有的炒作,人们会看到类似这样的机器学习和看到的只是闪亮的外面。他们会说,'哦,我们需要做的,”她解释说。“每一天的部分原因是至少有一些解释什么是可能的,它是如何工作的。”

这份工作最好和最坏的部分

会议是乔治一天中最喜欢的部分:“它们让我热爱我的工作,”她说。

罗萨里奥,她过去的角色包括一段时间作为a机器学习作为Facebook的工程师,这份工作最好的部分已经随着时间的推移发生了变化。

“当我在硅谷工作过,我最喜欢的部分是按摩的数据,”他说。“数据经常来我们在一个混乱的格式,或理解只能通过特定的软件,我想将其移动到格式,使其消化。”

作为顾问,他喜欢向人们展示数据可以做什么。

“很多人知道他们需要数据方面的帮助,但他们不知道用这些数据能做什么,”他说。“这感觉就像一个魔术师,把他们的思想开放到各种可能性。这种探索和努力是我现在最喜欢的部分。”

Long最喜欢的有很多,包括研究待解决问题的背景的初始阶段,以及找出获取必要数据的方法,然后一头扎进去。

尽管一些报告表明,数据科学家们仍然花费过多的时间在计算机上“家居”的任务“我不认为它是清洁卫生,”龙永图说。“我认为它是在挖掘和理解它的一部分。”

至于那么激动人心位,“我不希望有管理项目,”龙永图说。这样做的意思是“我经常要花费时间来管理其他人的工作重点,同时试图让我自己的事情做好。”

至于罗萨里奥,谁是在统计和数据科学,建筑系统和软件工程培训的是他更喜欢的部分不再强调。

准备中的作用

这已经不是什么秘密,数据科学需要大量的教育,而这三个专业人士也不例外。LatentView分析乔治拥有学士学位与工商管理硕士学位以及电气和电子工程硕士学位,她说。

罗萨里奥持有的计算统计的学士学位和数学,以及在统计的MS和加州大学洛杉矶分校计算机科学硕士学位;他目前正在完成他的博士在统计有。

至于MedeAnalytics'长,她认为在行为神经科学的博士学位,重点是学习,记忆和动机。

“我厌倦了追逐数据,”Long打趣道,他指的是科学界进行的实验。“作为一名科学家,你一半的工作是做数据分析,我真的很喜欢这方面。我对发挥实际作用也很感兴趣。”

的下一个前沿

而这里将事情何去何从?

乔治以物联网(IoT)等发展为例表示:“我认为未来会出现更多数据。”“未来,所有高级和中级管理职位都将纳入数据管理的某些方面。”

在越来越注重流数据的手段,“很多更多的工作需要做,”罗萨里奥同意。“我们将看到更多强调发展的算法和系统,可以合并到一起流数据。我看到的东西,如物联网和流数据是下一个前沿领域。”

他补充说,安全和隐私将是这个过程中需要解决的主要问题。

Long说,数据科学家仍然经常被认为是“独角兽”,这意味着他们被要求单枪匹马地做所有事情,包括所有的编码、数据处理、数据分析等等。

“很难让一个人负责所有的事情,”她说。“未来有望出现不同类型、拥有不同技能的人。”

赠言

对于那些考虑数据的科学事业,罗萨里奥主张奉行至少硕士学位。他还建议想尝试在数据方面。

他说:“我们身边都有问题,无论是管理财务还是计划度假。”试着想想如何利用数据解决这些问题。询问数据是否存在,并设法找到它。”

对于早期投资建设的经验,共同意见认为从网站如Kaggle,然后找出可以使用它来解决的问题找到一个数据集。

“我的建议正好相反,”罗萨里奥说。“选择一个问题,然后找到解决它所需的数据。”

“我觉得最好的准备是科学方法的一些感觉,或者你如何看待问题,” MedeAnalytics'龙永图说。“这将决定你如何处理数据,并决定使用它。”

工具是可以掌握的,但“解决问题的敏感性是你需要擅长的,”她补充道。

当然,最终的数据科学家最后一英里是展示他们的成果,乔治指出。

“有很多细节,”她说。“如果你是一个很会讲故事的人,如果你能编出一个故事,那就没有什么能比得上它了。”

加入网络世界社区有个足球雷竞技app脸谱网LinkedIn对最重要的话题发表评论。

版权所有©2016Raybet2

工资调查:结果是