数据科学中各职业都在做什么?有什么区别?
作者:CQITer小编 时间:2018-12-13 16:42
本文是 TalkingData University 翻译自 George Liu 发表在 hackernoon 的一篇文章,介绍了数据科学中不同角色的定义及相互之间的关系。并且给出了能力画像,为从业人员的求职及发展提供了清晰的参考。
如果你在考虑从事数据科学的工作,可能会觉得这个领域有点令人困惑!什么是数据科学家?数据分析师和数据科学家之间有什么区别?机器学习工程师做什么?那么数据工程师、商业智能( BI )工程师和机器学习( ML )研究员呢?
在这篇文章中,我们将描述数据科学中的不同角色,解释他们的定义以及差异。我们还将为每个角色建立一个“理想能力画像”。这对于职业满意度和求职成功非常重要——如果你申请了一个适合你的角色,你将有更大的机会获得这份工作;如果你做了自己喜欢的事情,那么你会享受,而不是每天都想逃避!
下面一起看看数据科学中的不同角色。我们会做一些扩展,以涵盖对具有数据技能的候选人来说,所有可考虑的数据科学职业角色。
从广义上讲,我们可以将数据角色分为两类:业务导向或工程导向。不同之处在于,业务向角色需要兼备技术和业务技能,例如沟通和演示;而工程向的角色着重在建模和软件工程技能上。
另一方面,一些传统角色已经存在了很长时间,而其他角色仅仅出现了几年或者刚刚兴起。让我们更详细地看一下每个角色。

从本质来说数据分析师和数据科学家是相同的,因为他们做同样的事情——从数据中获取价值。价值可以有不同的形式:对于数据分析师来说,价值意味着洞察,而对于数据科学家来说,是在洞察之上的产品发展智能。
数据分析师分析数据以获得洞察,并帮助形成业务决策。例如是什么导致网站流量增加,或者用户离开网站的主要原因是什么?而数据科学家更关心的是使用机器学习和 A / B 测试来驱动和改进产品。他们可能会对诸如“更大尺寸的按钮会增加点击率吗?”以及“哪些客户可能取消订阅?”等问题感兴趣。
数据科学家专注于前瞻,即做出预测,而数据分析师则更多地聚焦在回顾,如分析历史数据。
数据科学家应该更有经验,能够用科学的方法解决业务问题,包括构建业务问题、提出假设,然后设计和进行实验来检验假设,最后得出结论(主要是研究技能,这就是为什么硬科学博士有时候是数据科学家角色的首选候选人)。而数据分析师应该使用报告或数据可视化技术收集,清理,分析数据并传达结果。
以上是这两个角色之间的一般差异,但情况并非总是如此,因为数据科学仍然是新的方向,并且远未实现标准化。有时数据科学家可以进行基本分析工作,数据分析师可以执行机器学习建模。对于数据科学中分析类的角色而言,无论头衔如何,这两类绝对是最受雇主追捧的重要角色。因此在求职时应考虑与画像的最佳契合,并成为我们的目标(以下角色同理)。
需要指出的是,这里我们指的是通常意义的数据科学家,主要处理统计建模,A / B 测试,机器学习,数据清洗和数据可视化。而专注机器学习的数据科学家,我们实际上将其归类为机器学习研究员/科学家,下文会有介绍。
数据工程师我们已经讨论了很多关于数据科学家的事情,但实际上,如果没有数据工程师的帮助,数据科学家就无法做出贡献。为什么?由于数据工程师构建了引入数据的数据管道!如同炼油厂闲置,是由于没有原油进入,最终原因是石油管道还没有建成。
我们举一家广告技术公司为例,我们有来自多种内外部数据源的实时数据;有来自服务器的广告投放数据,来自我们内部数据库的投放和客户数据,还有来自第三方提供商的投放效果数据和我们的内部日志……为了构建实时广告效果分析看板并进一步做分析和建模,我们需要将所有数据整合成合适的级别。在此之上,我们需要构建一个数据仓库,以便我们的查询不会影响生产服务器的性能。
这就是数据工程师为我们提供的帮助。如你所见,这基本上是数据的软件工程。
ML / DL / AI研究员/科学家/工程师

