cda

数字化人才认证

您的位置:首页 > 活动列表 > 业界深访 | 产品总监眼中的数据科学家

业界深访 | 产品总监眼中的数据科学家

2018-10-30


在大数据和机器学习的时代,有一种职业脱颖而出——数据科学家。数据科学家在近年来备受追捧,也有越来越多的人想投身入数据科学领域。

最近,CDA 采访了几位来自不同行业的数据科学团队负责人,聊聊他们眼中的数据科学家是什么样的,以及对于初入数据科学行业的人群有些什么建议。

今天请到的是来自新浪微博的产品总监——王大禹,让我们看看产品眼中的数据科学家是什么样的吧。

点击播放采访视频,建议wifi下播放。
http://edu.cda.cn/course/946/task/16001/show

以下是采访的文字整理部分。

王大禹,新浪微博产品总监


大家好,我是王大禹。目前在新浪微博工作,任产品专家。

在新浪微博之前,我曾经服务于美非能源和微软。在以前的公司我都做过和数据相关的一系列工作。目前我在新浪微博负责给微博的内容和用户进行属性分类。

对于内容,要知道内容在讲什么;对于用户,要知道他们喜欢什么,喜欢看什么、喜欢发表什么内容。这样我们能根据相应内容找到相应的读者,让微博的用户可以阅读到他们喜欢类型的内容,想获得想得到的信息。

与此同时,我还负责一个数据平台。这个数据平台会汇集着微博上所有的文本的信息、图片视频信息以及用户行为数据。这些数据支持着我们进行内容和用户的计算,以及相应内容和相应用户之间的匹配计算。

Q 1:在微博这样伟大的产品中,有多少数据分析师参与?他们起到多大的作用呢?

目前来看,微博中有大量的数据分析师。他们对我们产品进行策略的更新,策略的更新指的是,在呈现内容的时,有多重方式可采取,那么哪种方式最好,我们要用数据来说话。

同样,比如说有一种新的推荐办法,我们想看这个办法是否适合某种类型的用户和内容的推荐。这时我们要做一些实验,比如Telemetry(计量数据收集),收集一些数据,通过数据来看下一个解决方案是会对性能有提升。

数据科学家就帮我们来解决了这个问题。数据科学家越来越多地融入到产品和算法工程师的工作中来。当然也有一些会编程的数据分析师,他们有些担任算法工程师。这就是目前我们公司数据分析师的的情况。

据我了解,不仅仅是互联网IT行业大量需要数据分析师,大量传统的企业同样需要。比如戴姆勒、西门子等传统公司,他们也在大量招收数据科学家,希望数据也能为公司决策起作用。

数据的作用我觉得分为两个层次。一个层次是战术层次,就是短期计划或市场计划。比如说计划会起多大效果,是否有作用,做完事情需要用数据进行评估,那么数据分析师就可以起到这个作用。

其次从高层程度说,公司一个年度,甚至几年的战略决策,当中也离不开数据分析师的支持。比如说保险公司、金融行业,以及现在常说的金融科技领域,这些都非常依赖数据分析师、数据科学家以及数据工程师等职业来帮他们从数据中挖掘信息,然后用挖掘出来的信息指导公司战略决策。

Q 2 :您觉得当下企业需要的数据科学家应该具备哪些技能?

我觉得可分为硬技能和软技能。硬技能方面,第一是对数据最基本的处理技能。


尤其是小公司或大公司的初始项目,这类公司以及这类项目中,收集的数据往往是未经过清洗的,或者非常有可能是非结构化的。这些数据中可能有一部分是错误数据,不能放到处理之中。还有一部分数据需要经过处理,才可能进入到训练模型或训练算法中。因此最基本的数据处理的能力是要有的。

第二,编程技能。

最起码需要掌握像Python这种简单、高效的脚本语言。因为在处理有些数据时,的,如果不会这些语言是很难做到的。

举个最简单的例子,如果我要把一周的数据按天分成七列数据,通过写一个简单的脚本就能很容易做到。但如果否则用Excel等其他工具来完成会非常困难,甚至是不可能的。

如今,我们已经由大数据时代进入人工智能时代。大数据时代讲究的是,收集这些数据,并利用这些数据。那么在收集和存储数据时,显然需要用到大数据相关的技术,因此大数据相关知识也是必备的。

收集到了数据之后,我们还需要用人工智能算法来处理。

人工智能算法中最有代表性的一类就是机器学习算法。因此需要对最常用的机器学习算法,包括有指导的、半指导的、无指导的这些算法有一些理解,以及掌握这些算法适合哪种应用场景。

第三,再高级一点的说就是需要具备项目管理和产品管理的能力。

因为对于大型公司而言,他需要了解整个软件开发的周期和流程,以及整个产品的生命周期。比如,收集市场和用户的反馈意见;把意见形成新的需求列表;用优先级对需求列表排序;用大量收集数据来进行项目评估。如果掌握项目管理和产品管理的流程,就能更好的融入工作当中。

第四,还有自然语言处理等其他硬技能。

国内许多项目中,收集到用户评论等语言相关数据都是非结构化的。因此在处理用户评论等非结构的文本中,自然语言处理知识是必要的。

除了硬技能,软技能也至关重要。软技能指的是在职场中解决问题所具备的能力,主要是沟通能力。

你要知道公司想让你做什么,做完之后需要把结果告诉大家。你需要根据公司的战略和长远目标做好自己的工作,并更好地进行拓展,这些都是非常重要的。同时你还需要能够很好地与公司同事和领导进行沟通,这些都是软技能。


Q 3:您认为或者您当前工作中,数据科学家需要具备的一个最重要的能力是什么?

我觉得最重要的技能是如何把这些数据分析相关的知识和理论落地,即了解其应用领域。

我曾经提出过一个G+S理论。G类学科指的是通用类的学科,包括外语、计算机知识编程这些技能,也包括数据分析和处理的技能,以及财务会计这类技能。

这些技能是不分领域的,任何领域都需要。无论是工业、农业、商业等,这行业都需要数据分析师来提供数据方案。

除此之外就是S类技能,即特殊领域的知识,比如说金融领域、医疗领域、IT互联网等领域。

如果比起其他人,你十分了解这个领域,那么的你竞争力也就更强。无论是人工智能算法还是数据分析方法,你都必须要知道这个领域是做什么的,这个领域在当前发展情况下,痛点和难点是什么。

因此我觉得,无论是大数据、数据科学家,还是人工智能,如何把这些知识技能在某领域落地,这是非常重要的。

Q 4:请您给正在职场打拼的数据科学家、数据分析师、以及数据工程师们一些职业发展建议!

我想有三个建议。

第一,作为数据科学家需要掌握很多硬技能,CDA的Level 1、2和3课程中就已经完整覆盖了这些技能。在就业中,需要针对不足的技能进行补充,因为有些想从事数据分析行业的同学是来自非理工学科的,没有任何编程的技能,那么就需要针对具体方面的进行学习。

比如学习Python和R语言等,取长补短。如果不了解机器学习、NLP方面也可以进一步学习。必须完善整个知识结构,因为数据科学是跨领域的学科。它不单纯是数学、统计、计算机或商业分析等方面,而是跨领域的,因此要保证知识结构的健全。

第二,熟悉具体应用领域。

数据科学家一定要熟悉他所工作的领域,不能是割裂的、只是单纯做数据。而是要了解整个公司的背景,了解所在的部门的背景,这是必不可少的。

第三,提升软技能。

主要涉及到数据呈现。我们在收集和分析数据等环节已经完美地完成了数据科学家的职责,那么就结束了吗?不一定。还涉及到呈现数据的方式。

数据的呈现需要一定技巧,因为除了在帮助公司决策之外,公司也需要用数据呈现给投资方和市场,从而体现公司有良好的目标。

数据的呈现本身就是艺术。随着工作经验的积累,你首先要知道公司和上级需要你做什么,希望通过你的数据得到什么样的结果,并且希望呈现出来什么成品。

CDA 数据分析师确实能帮助大家走向数据科学家之路。

目前,全球范围内很多有名的大学都开设了数据科学课程,但是通过这些课程是一个漫长的过程,而在CDA我们尽可能用最直接的方式,用最符合业内需求的课程的内容教授数据科学技能。这是非常好的事情,因为市场需要这些人才,据我了解很多公司都苦于寻找出色的数据科学人才。

Q 5:您对CDA LEVEL 3 数据科学家人才标准有何建议和期待?

据我了解,CDA Level III是CDA中最高级别,也就是专家级别,当中主要覆盖三块,分别是数据治理;大数据相关技术以及机器学习。正如我之前所说的,这三部分是数据科学家的必备技能。

学完这些内容之余,我觉得可以学一些自然语言处理方面的内容,然后如何将知识在具体的应用领域应用。

另外,商业方面知识也是必备的。

数据科学家需要为公司的战略决策提供数据支持,了解一些市场商业方面知识是非常有帮助的。

如今数据科学家的薪水是很可观的,以我的一位学生为例,他在美国读了MBA,现在的年薪在12万美元左右。目前国内的数据科学家主要以初、中级为多,大概的年薪约在20万到60万之间,数据科学家专家年薪约为60万到100万。

我很期待CDA Level 3毕业的学员未来几年的发展,目前许多公司都渴望这些高级人才,越高级的人才实际上越难招。我觉得在这方面CDA做了很大的贡献,为市场输送了很多优秀的数据分析人才,最后祝各位CDA Level 3学员前程似锦,在数据科学职业道路上大展身手。


如何进阶为数据科学家

CDA LEVEL 3数据科学家精英培训已正式发布,旨在面向从业多年的、有技术基础的大数据及数据分析专业人士、数据工程师等,为他们提供一个成为数据领袖的跳板。了解更多详情:https://www.cda.cn/kecheng/53.html

完 谢谢观看

分享
收藏

OK