为什么这么多数据科学家放弃他们的工作

原文:

是的,我是一个数据科学家,并且是的——你读对了标题,必须有人说出来。我们读过很多关于数据科学是21世纪最性感的工作的故事,作为数据科学家你可以赚到诱人的薪资,这似乎是绝对的理想工作。考虑到这个领域包含了大量的高技能人才,他们会努力解决复杂的问题(是的,这是一种积极的做法),你完全可以热爱这份工作。

但事实是,正如英国《金融时报》一篇文章所述,数据科学家通常“每周花1-2小时寻找新工作”。此外,该文还指出,“机器学习专家找工作的开发人员的的榜首占14.3%。数据科学家们紧随其后,为13.2%。“这些收集的数据由Stack Overflow 基于对64000名开发人员的调查。

我也曾处于这样的位置,最近也换了数据科学的工作。

为什么有这么多数据科学家在寻找新工作呢?

在回答这个问题之前,我应该澄清一下,我仍然是一名数据科学家。总的来说,我喜欢这份工作,我不想阻止其他人成为数据科学家,因为它可以是有趣、激励和有回报的。这篇文章的目的就是要唱反调,揭露这份工作的一些负面影响。以下是我的观点:

1.期望与现实不匹配

我认识的许多初级数据科学家(包括我自己)都想进入数据科学领域,因为数据科学就是要用很酷的新机器学习算法来解决复杂的问题,而这些算法会对企业产生巨大影响。这是一个机会,让我们觉得我们正在做的工作比我们以前做过的任何事情都重要。然而,通常情况并非如此。

我认识的许多初级数据科学家(包括我自己)都想进入数据科学领域,因为数据科学就是要用很酷的新机器学习算法来解决复杂的问题,而这些算法会对企业产生巨大影响。这是一个机会,让我们觉得我们正在做的工作比我们以前做过的任何事情都重要。然而,通常情况并非如此。

每家公司都是不同的,所以我不能代表所有公司,但许多公司在聘用数据科学家时,没有合适的基础设施来开始从人工智能中获取价值。这就导致了人工智能的冷启动问题。再加上这些公司在雇佣初级员工之前没有先雇佣资深/有经验的数据从业者,你获得的是解决双方幻想破灭和不愉快关系的方法。数据科学家可能是来编写智能机器学习算法来驱动insight,但他们不能这样做,因为他们的首要工作是整理数据基础设施和/或创建分析报告。相比之下,该公司只想要一张能每天在董事会上展示的图表。公司会感到沮丧,因为他们没有看到价值被足够快地驱动,所有这些导致数据科学家对他们的角色不满意。

Robert Chang在他的博客中给初级数据科学家的建议有深刻的见解:

重要的是要评估我们的愿望在多大程度上符合我们所处的环境的关键路径。寻找关键路径与您最一致的项目、团队和公司。

这突出了雇主和数据科学家之间的双向关系。如果公司的位置不对,或者公司的目标与数据科学家的目标不一致,那么数据科学家找到其他目标只是时间问题。

另一个让数据科学家大失所望的原因和我对学术界大失所望的原因类似:我相信我能够对世界各地的人产生巨大的影响,而不仅仅是在公司里。实际上,如果公司的核心业务不是机器学习(我之前的雇主是一家媒体出版公司),那么你所从事的数据科学很可能只会带来很小的增量收益。这些因素加起来可能会产生非常重要的影响,或者你可能很幸运地偶然发现了一个金矿项目,但这种情况不太常见。

2.道路正确

如果你真的认为了解大量的机器学习算法会让你成为最有价值的数据科学家,那么回到我上面的第一点:期望与现实并不匹配。

事实上,在这个行业中最有影响力的人需要对你有良好的印象。这可能意味着你必须经常做一些特别的工作,比如从数据库中获取数据,在正确的时间交给正确的人,做一些简单的项目,只是为了让正确的人对你有正确的认识。在以前的工作岗位上,我经常要这样做。让人沮丧的是,这是这份工作的必要部分。

3.你是任何数据的联系人

为了取悦正确的人,你需要做任何事情,但这些拥有所有影响力的人往往不理解“数据科学家”的含义。这意味着你将成为分析专家和报告专家,别忘了你也将成为数据库专家。

并不是只有非技术主管才会对你的技能做出过多的假设。其他技术部门的同事会认为你对与数据相关的一切都了如指掌。你对Spark、Hadoop、Hive、Pig、SQL、Neo4J、MySQL、Python、R、Scala、Tensorflow、A/B测试、NLP、任何机器学习(以及任何你能想到的与此相关的数据)都很熟悉。这就像是来自一家不知道自己数据策略的公司的工作要求,他们会雇佣任何人,因为他们认为雇佣任何数据人员都可以解决他们所有的数据问题)。

但它还不止于此。因为你知道所有这些,你显然可以得到所有的数据,你被期望得到所有问题的答案5分钟前就该送到相关人员的收件箱了。

试图告诉每个人你真正知道和控制的东西是困难的。不是因为别人会看不起你,而是因为你是一个没有什么行业经验的初级数据科学家,你会担心别人看不起你。这可能是一个相当困难的情况。

4.在一个独立的团队中工作

当我们看到成功的数据产品时,我们经常看到经过专业设计的、具有智能功能的用户界面,最重要的是,一个有用的输出,至少可以让用户感觉到它能解决相关问题。现在,如果一个数据科学家只把时间花在学习如何编写和执行机器学习算法上,那么他们就只能成为一个团队中很小的一部分(尽管是必要的),从而能够帮助一个项目取得成功,从而生产出有价值的产品。这意味着独立工作的数据科学团队将难以提供价值。

尽管如此,许多公司仍然有数据科学团队,他们开发自己的项目,编写代码来尝试解决问题。在某些情况下,这就足够了。例如,如果所需要的只是一个每季度生成一次的静态电子表格,那么它就可以提供一些价值。另一方面,如果目标是优化提供智能建议的定制网站建设产品,那么这将涉及许多不同的技能,这是不应该期望的绝大多数数据科学家(只有真正的数据科学独角兽可以解决这个问题)。因此,如果项目由一个独立的数据科学团队承担,那么很可能会失败(或者会花费很长时间,因为在大型企业中组织独立的团队进行协作项目并不容易)。

因此,要想在业界成为一名有效的数据科学家,光在Kaggle竞赛中表现出色并完成一些在线课程是不够的。幸运的是(不)(取决于您如何看待它),它涉及到理解层级和政治在业务中的工作方式。在寻找一份能满足你需求的数据科学工作时,找到一家与你的关键路径一致的公司应该是一个关键目标。但是,您可能仍然需要重新调整对数据科学角色的期望。

作者:Jonny Brooks-Bartlett


其他人还浏览了:



公众号

关注公众号,获取一手资讯

“ 为什么这么多数据科学家放弃他们的工作 ” comments 0

评论/回复

电子邮件地址不会被公开。 必填项已用*标注