泼冷水:为什么如此多的数据科学家正在抛弃他们的工作?
在你的印象中数据科学是21世纪最性感的工作,他不仅能够带来满意的薪酬,而且领域内大量高技能的“极客” 会帮你享受到思想碰撞的乐趣。
但英国《金融时报》的一篇文章中提到:“数据科学家每周花1-2个小时寻找新工作。”此外,文章还指出“在要找新工作的程序员的列表中,机器学习专家们以14.3%的比例名列第一。数据科学家们紧随其后,为13.2%。”这些数据是从对Stack Overflow 上的64000名程序员的问卷调查中来的。
那么,为什么有这么多的数据科学家在寻找新的工作呢?
在享受这份职业带来的激情与满足之余,总有一些消极的方面在给你泼冷水。下面文摘菌就为你带来四盆冷水,希望不要把你心中的热火扑灭~
期望和现实不符
大数据就像青少年的性爱:每个人都在谈论它,没有人真正知道如何去做,每个人都认为其他人正在做,所以每个人都声称自己在做。
——丹•艾瑞里
这句至理名言十分恰当的描述了初级数据科学家进入数据科学领域的初衷——每个人都不想让自己脱离群体。另外想用酷炫到爆的机器学习算法解决复杂问题,从而对企业产生巨大的影响,也是入坑数据科学的另一重要原因。
你或许认为你能从高超的技能中充分感觉到自我价值的实现。然而,事实往往并非如此。
期望与现实不符是许多数据科学家离开的根本原因。其中原委无法一一列举。
每个公司的情况都不尽相同。但许多公司雇佣数据科学家的时候都没有做好准备从人工智能中获取价值的准备,这就导致了人工智能的冷启动问题。
加之如果这些公司没有高级的或者资深的数据从业人员“撑场面”,那就不可避免的会出现让双方都处在失望和不愉快的境地。数据科学家们想要编写机器学习算法来创造有价值信息,但却做不到。
因为他们的第一项工作是整理数据基础结构或创建分析报告。然后公司会因无法看到可观的价值而感到失望。而这一切都会导致数据科学家们对他们现状的不满。
Robert Chang曾给初级数据科学家提供了一个非常有见地的建议:
你的雄心与你的团队所选择的方向是否一致是非常重要的。如果不一致,那么你就需要找到那些最适合你的项目、团队和公司。
这句话强调了雇主和数据科学家之间的双向关系。如果公司与数据科学家的目标不一致,那么数据科学家另择新主就只是时间问题。
数据科学家们感到失望的另一个原因是他们曾经相信我能够对世界各地的人们产生巨大的影响,而不是仅仅在公司内部。实际上,如果公司的核心业务不是机器学习,你所做的数据科学很可能只会带来小幅的增量收益。
政治最高
数据科学最困难,而且是不得不面对问题是:政治。
当我早上6点起床去学习支持向量机(Support Vector Machines)的时候,我想:“这真的很难!但是,嘿,至少我会变得对我未来的老板很有价值!”如果我能得到DeLorean时间机器,我就会回到过去,并对自己说“胡说八道!”
如果你真的认为了解大量的机器学习算法会使你成为最有价值的数据科学家,那么回到我的第一个观点:期望与现实不符。
事实是,在商业中最具影响力的人需要对你有不错的印象。这可能意味着你必须经常做一些从数据库中获取数据的简单项目,来使正确的人对你有正确的认知。
是的,这些工作令人很沮丧。但是,必不可少。
你想上天
希望能够成为取悦所有人的数据科学家,意味着将成为分析专家,去做报告的人,同时还是数据库专家。但是这往往偏离了数据科学家的含义。
不仅仅是非技术高管对你的技能有太多的假设,技术部门的其他同事也会假定你知道所有与数据相关的东西。你熟悉Spark、Hadoop、Hive、Pig、SQL、Neo4J、MySQL、Python、R、Scala、Tensorflow、A/B测试、NLP,以及任何与机器学习和数据相关内容。
顺便说一句,如果你看到一个岗位对上面这些都有要求,请保持远离。因为这说明这家公司不知道自己的数据策略是什么,他们会随便招人,因为貌似任何懂数据的人都可以解决他们所有的问题。
但它不止于此。既然你懂得这些技术,而且显然又可以拿到所有的数据,别人就会期望你在极短的时间内回答所有的问题。
尝试在可控范围内交底你的短板,你并不会真的得到轻视。而作为一个没有什么行业经验的初级数据科学家,你担心人们会轻视你。
在一个孤立的团队中工作
我们看到的成功的数据产品,往往具有设计巧妙且具有智能功能的用户界面。最重要的是,它至少会有一种有用的输出使得用户可以通过它来解决一个相关的问题。
现在的问题是,如果一个数据科学家只学习如何编写和执行机器学习算法,那么他们就只能是一个成功的项目,一个有价值的产品的团队的一小部分(尽管是必要的)。这意味着孤立工作的数据科学团队将难以提供价值!
尽管如此,许多公司仍然有数据科学团队提出自己的项目并编写代码来尝试解决问题。在某些情况下,这可能是有价值的。例如,如果公司需要的只是每季度一张静态的电子表格,那么它确实可以提供一些价值。
可另一方面,如果目标是为网站构建的优化提供明智的建议,那么这将涉及到许多不同的技能,而这对于绝大多数的数据科学家来说是不可能的(只有真正的数据科学独角兽才能解决这个问题)。
因此,如果项目由一个孤立的数据科学团队承担,它很可能会失败。
因此,要想成为一名数据科学的业界翘楚,仅仅在Kaggle竞赛中做得很好并完成一些在线课程是不够的。寻找一个与你的目标大方向一致的公司,应该是你在寻找能满足你需求的数据科学工作时的一个关键指标。但是,你可能仍然需要调整自己对从事数据科学的期望。
我希望我没有把你从这条路上拉下来。
数据分析咨询请扫描二维码
统计学基础 - 理解统计学的基本概念和方法是数据分析师必备的技能之一。统计学为他们提供了处理数据、进行推断和建模的基础。 数 ...
2024-11-25数据分析师在如今信息爆炸的时代扮演着至关重要的角色。他们不仅需要具备扎实的数据分析技能,还需要不断学习和适应不断发展的技 ...
2024-11-25数据分析师的工作职责涉及多个关键方面,从数据的获取到处理、分析再到可视化,旨在为企业的决策提供有力支持。让我们深入了解数 ...
2024-11-25数据分析师:洞察力量的引擎 数据分析师的兴起 数据分析师行业目前正处于快速发展阶段,市场需求持续增长,薪资水平也有所提升。 ...
2024-11-25数据收集与整理 - 从各种来源收集数据,清洗和整理以确保数据质量和可用性。 数据分析与建模 - 运用统计学方法和机器学习模型对 ...
2024-11-25数据分析是当今社会中不可或缺的一项技能,涵盖了广泛的工具和技术。其中,掌握各种数据处理函数对于数据分析师至关重要。本文将 ...
2024-11-25“大数据治理”是一个涵盖广泛的复杂概念,其核心在于确保大规模、多样化的数据资源能够被有效管理和利用。不仅涉及数据的采集、 ...
2024-11-25一、引言 背景介绍 随着信息技术的快速发展和互联网的普及,大数据已经成为现代社会的重要资产。大数据的兴起不仅推动了各行各业 ...
2024-11-25《Python数据分析极简入门》 第2节 7 Pandas分组聚合 分组聚合(group by)顾名思义就是分2步: 先分组:根据某列数据的值进行 ...
2024-11-25数据分析需要学习的内容非常广泛,涵盖了从理论知识到实际技能的多个方面。以下是数据分析所需学习的主要内容: 数学和统计学 ...
2024-11-24数据分析师需要具备一系列多方面的技能和能力,以应对复杂的数据分析任务和业务需求。以下是数据分析师所需的主要能力: 统计 ...
2024-11-24数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。以下是根据我搜索到的资料整理出的数据分析师需 ...
2024-11-24《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22