以下是受此博客启发的KDnuggets民意调查结果:
放松!数据科学家不会在10年内灭绝,但角色会改变
随着人工智能的进步继续突飞猛进,在基线上获得数据科学已经变得越来越民主化。该领域的传统进入壁垒,如缺乏数据和计算能力,已经被扫除,不断涌现的新数据初创公司(有些公司每天只需一杯咖啡就能访问数据),所有强大的云计算都消除了对昂贵的现场硬件的需求。除了三位一体的先决条件之外,实现的技能和诀窍可以说已经成为数据科学中最普遍的方面。人们不需要看很远就能找到兜售口号的在线教程,如“在几秒钟内实现X模型”,“在几行代码内将Z方法应用于数据”。在一个数字世界里,即时满足已经成为游戏的名称。虽然提高可访问性在表面上并不有害,但在令人眼花缭乱的软件库和闪亮的新模型之下,数据科学的真正目的已经变得模糊,有时甚至被遗忘。因为它不是为了这样做而运行复杂的模型,也不是为了优化任意的性能度量,而是用作解决现实世界问题的工具。
一个简单但相关的例子是Iris数据集。有多少人用它来演示一个算法,而不留心思考萼片是什么,更不用说为什么我们要测量它的长度了?虽然对于可能更有兴趣在他们的曲目中添加一种新模式的初露头角的从业者来说,这些似乎是微不足道的考虑,但对于植物学家埃德加·安德森来说,这并不是微不足道的,他编目了所讨论的属性来理解鸢尾花的变异。尽管这是一个人为的例子,但它展示了一个简单的观点;主流变得更加专注于“做”数据科学,而不是“应用”数据科学。然而,这种失调并不是数据科学家衰落的原因,而是一种症状。为了了解问题的根源,我们必须后退一步,鸟瞰一下。
数据科学有一个奇怪的区别,它是少数几个让实践者没有领域的研究领域之一。药学专业的学生成为药剂师,法律专业的学生成为律师,会计专业的学生成为会计师。数据科学专业的学生因此必须成为数据科学家?但是什么的数据科学家?数据科学的广泛应用是一把双刃剑。一方面,它是一个强大的工具箱,可以应用于任何生成和捕获数据的行业。另一方面,这些工具的普遍适用性意味着用户很少会在此之前对所述行业有真正的领域知识。然而,在数据科学兴起的时候,这个问题并不重要,因为雇主们在没有完全理解它是什么以及如何将它完全集成到他们的公司中的情况下,就急于利用这项新生的技术。
然而,近十年后,企业和它们所处的环境都发生了变化。他们现在努力与以既定行业标准为基准的大型根深蒂固的团队一起实现数据科学的成熟度。迫切的招聘需求已经转向问题解决者和批判性思维者,他们了解业务、各自的行业及其利益相关者。导航几个软件包或反流几行代码的能力不再足够,数据科学从业者也不再被编码的能力所定义。no code、AutoML解决方案(如DataRobot、RapidMiner和Alteryx)的日益流行就证明了这一点。
数据科学家将在10年内灭绝(要么放弃),或者至少角色头衔将是。展望未来,被统称为数据科学的技能集将由新一代精通数据的业务专家和主题专家承担,他们能够用自己深刻的领域知识进行分析,无论他们是否会编码。他们的头衔将反映他们的专业知识,而不是他们展示专业知识的手段,无论是合规专家、产品经理还是投资分析师。我们不需要回头看很远就能找到历史性的先例。在电子表格出现的时候,数据输入专家是非常令人垂涎的,但现在,正如Cole Nussbaumer Knaflic(“用数据讲故事”的作者)恰当地观察到的那样,熟练使用Microsoft Office suite是最低限度的。在此之前,用打字机触摸打字的能力被认为是一项专业技能,然而随着个人计算机的可访问性,它也被认为是一项专业技能。
最后,对于那些考虑从事数据科学工作或开始学习的人来说,经常回顾一下你无疑会遇到的维恩图可能会对你有很好的帮助。它将数据科学描述为统计学、编程和领域知识的汇合。尽管每一个都占有相等份额的相交面积,但有些可能会保证比其他的更高的权重。
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 8-1 Pandas 数据重塑 - 数据变形 数据重塑(Reshaping) 数据重塑,顾名思义就是给数据做各种变 ...
2024-11-26统计学基础 - 理解统计学的基本概念和方法是数据分析师必备的技能之一。统计学为他们提供了处理数据、进行推断和建模的基础。 数 ...
2024-11-25数据分析师在如今信息爆炸的时代扮演着至关重要的角色。他们不仅需要具备扎实的数据分析技能,还需要不断学习和适应不断发展的技 ...
2024-11-25数据分析师的工作职责涉及多个关键方面,从数据的获取到处理、分析再到可视化,旨在为企业的决策提供有力支持。让我们深入了解数 ...
2024-11-25数据分析师:洞察力量的引擎 数据分析师的兴起 数据分析师行业目前正处于快速发展阶段,市场需求持续增长,薪资水平也有所提升。 ...
2024-11-25数据收集与整理 - 从各种来源收集数据,清洗和整理以确保数据质量和可用性。 数据分析与建模 - 运用统计学方法和机器学习模型对 ...
2024-11-25数据分析是当今社会中不可或缺的一项技能,涵盖了广泛的工具和技术。其中,掌握各种数据处理函数对于数据分析师至关重要。本文将 ...
2024-11-25“大数据治理”是一个涵盖广泛的复杂概念,其核心在于确保大规模、多样化的数据资源能够被有效管理和利用。不仅涉及数据的采集、 ...
2024-11-25一、引言 背景介绍 随着信息技术的快速发展和互联网的普及,大数据已经成为现代社会的重要资产。大数据的兴起不仅推动了各行各业 ...
2024-11-25《Python数据分析极简入门》 第2节 7 Pandas分组聚合 分组聚合(group by)顾名思义就是分2步: 先分组:根据某列数据的值进行 ...
2024-11-25数据分析需要学习的内容非常广泛,涵盖了从理论知识到实际技能的多个方面。以下是数据分析所需学习的主要内容: 数学和统计学 ...
2024-11-24数据分析师需要具备一系列多方面的技能和能力,以应对复杂的数据分析任务和业务需求。以下是数据分析师所需的主要能力: 统计 ...
2024-11-24数据分析师需要学习的课程内容非常广泛,涵盖了从基础理论到实际应用的多个方面。以下是根据我搜索到的资料整理出的数据分析师需 ...
2024-11-24《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22