在小公司如何做一名成功的数据科学家?
作者:网友投稿 时间:2019-02-18 16:50

大数文摘出品
来源:medium
编译:王媛媛、刘思佳
小公司需要数据科学家么?
可能只有长期混迹数据圈的老司机才有资格回答这个问题。
本文作者Randy Au,已经在15-150人规模的公司工作了近12年,被冠于“数据分析师、工程师、偶尔还有科学家”的各种头衔。
作者是社会科学出身,有一些自然语言处理,应用数学和工商管理经验。总而言之,什么都会一点。
以下是他关于此问题的看法:
成为第一个“数据全能选手”

小公司不需要数据科学家,但他们需要一个“数据全能选手”。他们可能称这项工作为“数据科学家/工程师/分析师/忍者”,诸如此类。
一家20-60人规模的公司,有足够的客户,丰富的数据和专业化的岗位,只需要招一个能够使用数据来提供有用的业务洞察力的人。
职位的头衔不重要,但职位描述往往是各种各样的混合:
理解我们拥有的数据
帮助构建我们的数据系统
帮助我们进行数据驱动/运行实验
发展业务
可能与任何事物相关或不相关的教育/认证
通常情况下他们并不完全了解需要怎样的人才。只有一种普遍意义上的“我们有数据,看起来很有用,但是缺少转化为价值的技能。”
实际上,在这个职位上的人需要同时做两件大事:
今天-帮助公司取得成功
明天-打造数据驱动型公司
今天-帮助公司取得成功

初创公司充满了不确定性。他们不确定客户是谁,生产系统可能很困难,不知道客户对产品做了什么,不知道如何使用拥有的数据做出决策,不知道拥有的数据是否有用。
对问题的巧妙回答可以带来更明智的决策,并希望每个人都梦想成为神话般的曲棍球棒。难题是大多数问题都不适宜用花哨的方法。有用的通常是老办法和基于定性方法而不是定量。
在优化现有流程时,大多数DS方法都是最强大的,它们可以在获取客户,转化客户,客户粘度和客户支出等方面实现5%,10%甚至25%的增长。A / B测试,推荐系统,ML分类器,所有这些都有助于优化。收益是真实的,可量化的,并且可能是显着的,但早期可能会更重要的事要做。
早期最大的影响往往是业务洞察。洞察力从根本上改变了公司做的事情。它们来自很常见的事情,例如研究用户偏好/行为,为销售人员揭示新的营销概念,或帮助产品团队意识到Twitter上最受憎恨的功能实际上被90%的付费客户使用。
我对“帮助公司”角色的看法是:“数据全能选手”是一种力量倍增器 。企业内部的人有问题,工作就是帮助他们解决问题。
成为第一个“数据全能选手”=成为“有数据的科学家”!
作为一名科学家对我来说意味着你遇到一个难题,一个研究型问题,你可以用任何方法来找到对这个问题的坚实答案。
作为数据科学家,我们倾向于使用定量方法和从系统收集的数据来回答问题,但这不是获得洞察力的唯一途径。有时你精尽全力观察或询问用户(定性方法),或者你出去收集数据(实验和调查),或者你盯住别人(竞争分析)。
一个好的科学家不会通过他们的方法来定义自己,第一个数据全能选手(或者任何数据全能选手)也不会。
我们的目标是满足紧迫的业务需求:“为什么没有人使用我们的产品?”“我们的回报怎么这么高?”我们是否应该进行这种昂贵的销售呢?““是什么导致客户流失?”“什么是客户的终身价值,是什么推动了这一点?”
明天-打造数据驱动型公司
我看到的一个常见的陷阱是来自数据科学计划的人加入这些职位,期望使用像Spark这样的性感东西并应用RNN来完成他们的工作。但很遗憾,不匹配是非常残酷的。

花哨的“数据科学”方法依赖于大量的东西,不要指望每一层在移动到下一层之前都“完成”。把颜色想象成“ 花费的时间”。



