数据科学家将成为2015年最热门的职业
1月3日,你擅长数学,会用Python编程,而且还对某个行业了如指掌?
如果你拥有这样的技能集,那你就有可能当上数据科学家。而如果你当上了数据科学家,那你的日子就可以过得风风光光了――LinkedIn的最新投票结果显示,“统计分析和数据挖掘” 是2014年最大的求职法宝。
美国招聘网站Glassdoor的报告称,数据科学家的平均年薪为118709美元(约合人民币737550元),而程序员的平均年薪为64537美元(约合人民币400974元)。麦肯锡公司的一份研究预测称,到2018年,在“具有深入分析能力的人才”方面,美国可能面临着14万到19万的缺口,而“可以利用大数据分析来做出有效决策的经理和分析师” 缺口则会达到150万。
该领域目前异常火爆,纽约大学数据科学中心课程的负责人罗伊-洛伦斯(Roy Lowrance)表示,现在可能已经到了巅峰期。“也许存在着泡沫,” 他说。 “无论什么事情,一旦变得这样火爆,之后就肯定就会冷下来。”不过,纽约大学希望在未来几年里扩大数据科学课程的招生规模,把学生人数从40名增加到60名。本学年还有五个月才会结束,但50%到75%的学生已经找到了比较理想的工作。
为什么该领域会变得如此火爆?琳达-博奇(Linda Burtch)是芝加哥的猎头公司博奇工程的董事总经理,她表示,尽管像谷歌(微博)、亚马逊、Netflix和Uber这样的高科技公司都有自己的数据科学团队,但那些非高科技公司,比如Neiman Marcus、沃尔玛、Clorox和Gap,它们现在也需要使用这方面的人才,“很多公司都在物色数据科学家,”她说。
这些公司希望,数据科学专业人才可以挖掘新的信息,来帮助公司开源节流。IBM负责大数据业务的副总裁Anjul Bhambhri表示,航空航天制造商Pratt & Whitney现在可以预测出飞机发动机何时需要进行维护,准确率达到97%,这可以帮助它更加有效地开展业务。
虽然IBM在本月刚刚推出了基于云计算的Watson Analytics免费增值工具,但是,为了分析非结构化数据,数据科学家常常不得不亲自动手编写专门的软件程序,这正是数据科学家必须掌握编程技巧的一个原因。
学校教育
洛伦斯说,数据科学家需要具备三项基本技能:数学/统计、计算机能力、在特定业务领域的知识。纽约大学数据科学中心希望招收至少具备其中一种技能的学生,然后培养他们掌握其他技能,让学生到毕业的时候,可以独当一面负责处理数据工作。 “在学习过程中,他们要做一些数据科学项目,这些项目需要他们用到这三种技能,”他说。
但是,如果你想成为一名数据科学,也不一定非得去大学读书才行。从今年9月开始,一家名为梅蒂斯(Metis)的公司开始在纽约举办为期十二周的数据科学训练营,费用为1.4万美元。报名的人非常之多,入学竞争相当激烈。梅蒂斯公司的联合创始人杰森-莫斯(Jason Moss)说,大约有一半的学生都拥有硕士或博士学位。
第一期训练营在12月初结束。莫斯说,不过几周, 15名学生中就有6名拿到了聘用通知。
“我不认为训练营可以替代大学教育,”莫斯说。“训练营可以提供一条捷径,让你以最快的速度找到一份工作,但大学的目的不在于此。但我也不认为你必须上大学才能成为一名数据科学家,”他说。“有一种人,他们天生具有好奇心,有勇气,有决心,总想把事情理出头绪,他们在这一行可以干得很好。”
Anmol Rajpurohit是一名独立的数据科学家兼顾问,他说,做这一行工作最重要的素质就是能够快速学习东西。“与专长于任何特定编程语言相比,泛型编程技巧远远更加重要,”他说。 “在如今这个时代,技术的发展突飞猛进,语言会很快过时,新的语言则将迅速普及。因此,学东西很快的人,会比单独领域的专家更有前途。”
洛伦斯说,他认为,在某些技能方面,训练营和网上课程可以为学习者提供很大的帮助。但在另外一些方面,它们的作用就就相对有限了。纽约大学的数据科学课程有一个优势,就是可以按照正确的先后顺序来培养你的技能。“我们的教学顺序可以让你循序渐进、融会贯通地掌握技能。”他说。
数据科学家要做哪些事?
游戏公司Playstudios的数据科学家乔恩-格林伯格(Jon Greenberg)说:“在日常工作中,我需要管理一系列控制面板,它们提供的信息可以让公司知道,我们的生意到底做得怎么样? 用户在做什么事情?”格林伯格现在是一名经理了,所以他编程的时候没有以往那么多,但是他有时候仍然需要编程。通常来说,他把数据从Apache Hadoop的存储器里调取出来,在分析平台Revolution R上运行它,并对它进行一些可视化处理。 “比如说,我们可以从中得知一部分用户如何与新推出的功能互动,”他解释说。
六年前,格林伯格拿到了统计学的硕士学位。他希望进入政府部门工作,但却惊讶地发现,公司企业非常需要数据科学家。 “那个时候,数据科学领域还没有现在这么火爆,,”他说。现在,他每天都能从猎头那里收到一个电话或一封邮件。 “这种情况不只是发生在我身上,”他说。“所有的数据科学家可能都是这样。”
对于格林伯格来说,就业机会很好只是一个加分项,因为他本来就热爱这一行。 “我认为,要做数据科学工作,你必须得有分析头脑才行,而且还得有好奇心,”他说。“你必须得有灵活性和创造性,构思出不同的方法来解决问题。”这项工作的唯一缺点,格林伯格说,就是“清洁”数据(去掉那些没有相关性的结果)需要花费大量时间。“这部分任务并不是那么招人喜欢,你得花很多时间来做它。”他说。
Rajpurohit说,他花了很多精力来清洁数据和做研究。 “我很大一部分时间都花在做研究上,因为我经常会遇到全新的问题,因此,我需要研究特定领域最新文献,或者是找找专家,听听他们在这方面的看法,”他说。
“尽管数据科学这个名字和艺术毫不沾边,但是你需要把艺术和科学很好地结合起来。科学的部分很明显――数学,程序设计等等。但艺术部分是同样重要――创造力,对语境有着深刻的理解。把这两部分结合在一起,你就会变得善于解决问题。”
尽管如此,Rajpurohit也承认,数据科学并不像眼下很多人以为的那样善良迷人。这个领域确实是在变得越来越重要,而且也出现了很多高薪机会,但在数据科学家需要做的日常工作中,有很多其实都很枯燥。
你是当数据科学家的料吗?
每天花大量时间来编程,分析控制面板上的数据,获得相关信息,如果你对这样的工作感兴趣,那么你可能就适合干这一行。但如果你仅仅是想拿高工资,那么你可能就会觉得这样的日子过起来苦不堪言。你要知道:真正适合干这一行的人,常常会在业余时间里编写程序,分析数据,而他们这样做只是为了自娱自乐。
亚当-弗洛葛尔(Adam Flugel)是博奇公司的数据科学招聘猎头,他谈到了最近遇到的一名候选人。此人拥有博士学位,今年秋天将去电艺公司(Electronic Arts)工作。“真正让他脱颖而出的是优势是,他在空闲时间也做这种事情,而且纯粹就是为了好玩,”弗洛葛尔说。“他是多人在线游戏世界《坦克世界大战》的玩家,领导着一个玩家团队。于是他编写了一个从游戏服务器抓取数据的程序,然后进行数据分析,评估自己团队的表现。然后他利用这些信息来弄清应该如何调整自己的战略,应该招收哪些类型的成员,才能提升团队的整体表现。”
所以,如果你爱的并不是数据本身,而是它可以给你带来的高薪,那么你会发现,自己很难与那样的人竞争。但是博奇说,每个人都应该学会热爱数据,即便只是为了自己事业前途着想,也该这样做。 “十年之内,如果你不是数据大咖,你就别想升到‘首席XX官’的位置上”博奇说。
但是像史蒂夫-乔布斯、比尔-盖茨那样的情况又怎么解释呢?他们拥有远见卓识,并没有陷入数据科学的细枝末节之中。“那是30年前的事了,”博奇说。 “我说的是未来10年。”
数据分析咨询请扫描二维码
数据分析工具推荐 数据分析工具的选择至关重要。不同工具适用于不同的需求和场景。以下是一些推荐的数据分析工具,根据您的需求 ...
2024-11-27选择适合您需求的数据分析工具 数据分析作为商业决策过程中的关键环节,工具的选择至关重要。不同的工具适用于不同的场景和需求 ...
2024-11-27数据架构文档的编写涉及多个方面,包括内容结构、编写原则和具体要求。遵循规范可以帮助团队更好地理解和管理数据架构,支持项目 ...
2024-11-27挑战与解决方案概述 在数字化时代,数据开放共享对于推动创新和发展至关重要。然而,这一进程面临诸多挑战。保护用户隐私、确保 ...
2024-11-27促进科学研究和创新 数据开放共享为研究人员提供更广泛的资源和合作机会,加速科学知识的发展。通过访问他人的数据集,验证研究 ...
2024-11-27数据组织与存储策略 数据模型是数据仓库和商业智能系统的核心,通过合理的数据组织和存储策略,确保高效、低成本、高质量地利用 ...
2024-11-27持续关注数据系统运行状态 - 数据设计与开发完成后,维护与优化工作成为至关重要的环节。这个过程需要持续且细致的关注,以确保 ...
2024-11-27数据服务未来的趋势 智能化和自动化: 随着人工智能和机器学习技术的飞速发展,数据服务领域正逐渐朝着更智能化和自动化的方向 ...
2024-11-27未来最有前景的行业主要集中在以下几个领域: 人工智能与机器学习:人工智能被认为是未来最具潜力的行业之一,其应用范围广泛 ...
2024-11-27根据多条证据,目前多个行业展现出良好的发展前景。以下是一些被认为具有最好发展前景的行业: 人工智能与机器学习:人工智能 ...
2024-11-27学习数据分析后,可以在多种类型的单位找到工作机会。这些单位包括但不限于: 政府机关:数据分析师在政府机构中扮演重要角色 ...
2024-11-27必备的职业技能 统计学基础 - 理解概率、假设检验、回归分析等统计概念。 - 运用统计方法对数据进行分析和解读。 编程能力 - 掌 ...
2024-11-27基础课程 - 统计学基础: 统计学是数据分析的基石,包括概率、假设检验、回归分析等基本知识。这有助于分析师更好地理解数据背后 ...
2024-11-27数据分析领域涉及众多工具软件,涵盖了从数据处理、分析到可视化的各个方面。在选择适合自己需求的工具时,需要考虑数据规模、分 ...
2024-11-27在数据分析领域,选择合适的工具至关重要。不同的软件适用于不同的需求和技能水平。以下是几款值得考虑的数据分析软件: - Table ...
2024-11-27数据分析中常用的Excel与Python函数公式涵盖了广泛的应用场景。掌握这些基础和高级技巧对于成为一名优秀的数据分析师至关重要。 ...
2024-11-27Python是一种高级编程语言,由荷兰程序员Guido van Rossum于1989年圣诞节期间开始开发,并于1991年首次发布。Python的设计哲学强 ...
2024-11-27课程内容 数学基础: 高等数学、线性代数、概率论与数理统计、微积分等为算法设计和数据分析打下基础。 编程与算法: 掌握 ...
2024-11-27爬虫工程师是互联网时代中至关重要的职业之一,他们的工作内容主要涉及编写和维护网络爬虫程序,进行数据采集与清洗,设计系统架 ...
2024-11-27技能需求 数据管理与建模 - 掌握SQL、HiveQL、Spark SQL等数据库语言,进行复杂数据查询和分析。 - 使用数据建模工具如ER/Studio ...
2024-11-27