互联网和移动互联网时代,程序员成了公认的高薪工作,是众多企业的抢手人才。但凡大学专业沾边计算机的理科生,都有机会去竞逐一下互联网大厂的高薪岗位。
数据时代,数据人才就像之前的程序员成了企业的「香饽饽」,互联网大厂又开始招募大量数据岗位,根据《2020中国数字化人才现状与展望》报告显示,数据人才的需求在不断增加:
数据人才的岗位薪资也高于普通白领平均薪资:
面对这么大好的形势,这次难道没咱们文科生什么事情了吗?「我读的文科,我读的商科,我数学不好,我能学数据分析吗?」这也是我们被问的最多的问题之一。
其实文科生已经意识到自己的竞争对手会是数学好的理科生,所以他们的问题细化成两个就是:
· 如果不是计算机或者数学统计相关专业,他就不能做数据分析吗?
· 想转行数据分析师,应该学哪些技能或者编程语言?
我们根据服务过7万学生的经验,总结了三个关键,帮助文科、商科专业的学生成功找到数据好工作:
· 找对求职途径
· 找准就业企业
· 找好学习方法
进入一家公司一般有两种途径——常规的人力资源(HR)途径和内推途径。HR途径就是通过招聘人员、公司招聘网站、招聘系统,或者申请实习来找到工作;而内推途径则是通过招聘经理或者公司的现任员工来推荐申请工作。
HR途径上会根据硬性的专业要求、学历要求进行筛选,可能在你被面试之前,传统的HR途径因为你没有数学统计或计算机学位而剔除你。但在内推途径中,你通常能够直接地与决定是否录用你的人以及最终与你共事的人或团队打交道。
对于那些只拥有市场营销教育背景的求职者来说,获得一份数据科学家工作的最佳途径就是选择内推。
在BOSS直聘上以「数据」为关键词搜索,得到北京地区的前3226个热门岗位,我们可以看到:
3.1 最热门的岗位
数据分析师,是招聘职位里面最热门的,其次是大数据开发工程师、数据产品经理,说明在产品经理领域,数据的应用也是非常广泛。
3.2 薪酬水平
数据相关岗位的薪酬集中在月薪20-50K之间,部分高薪的可以到月薪50-100K,比如BOSS直聘就在北京以80-100K,16薪,招分布式存储计算平台专家,但要求是10年以上的工作经验,不要被这个工作经验吓到,看看接下来的统计。
3.3 工作经验的要求
我们可以看到工作经验的要求还是集中在1-3年,3-5年,其中经验不限的也占了较大比重,所以有志于从事数据行业的,可以大胆的尝试,这个行业很开放,另一个佐证就是下面的学历。
3.4 学历要求
本科是要求最多的,因此担心学历是不是必须要硕士的可以放心,数据告诉你:本科就满足大部分企业的要求。
3.5 招聘企业
从数据来看,在北京对于数据人才需求最大的企业是京东,接下来是滴滴、理想汽车。
3.6 最需要的技能
SQL、Python,数据分析,是这些数据岗位要求最多的技能。这些技能要怎么掌握,学习方法就至关重要了。
并不是所有想往数据方向发展的人都已经从事过数据相关的工作,但每个人都可以将自己曾经做过的数据相关的项目整理到一起,以此来展示自己在数据领域的工作能力。如果你做过一些很不错的项目,并且将它们展示在你的github或简历上,这将大大提高你找到工作的机会。
4.1 如何选择一个好的项目呢?
关于数据项目的选择,最重要的事情之一是它需要是非常有针对性且具有行业独特性。项目内容越具体、越紧密联系某个你感兴趣的行业,你就能越好地解释这个项目的意义。
选择的项目应该符合下列两个类别之一(或者两者都包括):
(1)这个项目是针对你想进入的某个行业或某份工作设计的——做这类项目可以证明你为什么要申请某个特定的职位。这还说明你对可能从事的领域已有了潜在的了解。
(2)这个项目对你来说是有趣的、有热情的——当你面试时,面试官谈论起这段经历,这一点热情就会变得很明显。当候选人对自己做过的项目感到自豪时,面试官是可以明显感受到候选人在被问到该项目时的那份激情的。
4.2 学习数据技能的最佳路径——「以终为始」的项目学习
你选择的项目应该大致遵循以下这样一个流程,并且在做完项目后你需要能够详细地描述当中的每个步骤。
Step 1: 解决一个实际数据问题——以终为始,课程的最后是怎么的项目?项目背景是什么?是出于什么原因要去做这个项目?(商业问题举例:希望通过历史数据评估营销渠道的效果,以此为明年的营销预算分配提供建议)
Step 2: 数据收集——好的项目要有数据收集的过程,既可以是直接从数据源下载数据集,或者是从某个渠道去使用API爬取。(例如使用python从Twitter上获取tweets相关的数据。)
Step 3: 数据清洗和聚合——这一步实在太重要了。没有这一步的项目都不是“贴合实际工作情况“的好项目。它是数据科学中最重要的一步。对数据格式的处理和清洗会对最终分析的结果产生非常大的影响。你需要通过项目去完全了解你在处理数据时做出决策的原因,比如如何处理缺失值,如何选择或提出某些变量特征,以及如何处理异常值等等。(例如某些天因为技术问题,无法收集到营销支出的数据。)
Step 4: 变量探索——这部分对于一个好项目来说也非常重要。因为在这部分分析中,你要去审视每一个变量的特点。你需要深入研究每个变量(或者叫特征)的分布,并评估这些特征之间的关系。为了显示这些关系,你需要使用诸如箱线图、直方图、相关性图等视觉效果。这一过程有助于告诉你哪些变量和数据可以帮助你解答你想要解决的商业问题。(例如显示每天不同渠道的营销费用的分布图,每天的平均花费。)
Step 5: 数据探索性分析——在这一步,你开始利用数据来探索趋势。可以使用数据透视表来了解变量和变量之间随着时间变化而变化的趋势。可视化的工具也应该在这一环节的分析中被大量运用。与前面一步非常相似,这一步也是帮助你来了解在模型中要放入哪些变量。(例如每个品牌每天的销量、营销支出与销售量之间的散点图,等等)
Step 6: 特征工程(或叫变量转换transformation)——这一步的分析非常重要(所以我将其单独列为一步),然而它通常应与数据分析(Step 5)同时进行。特征工程分为两种:
(1)创建可以提高预测准确性的新特征变量;
(2)改变数据的性质,使其更适合进行量化分析。好的项目会教你,在构建新特征变量时如何充分发挥创造性。你可以使用其他数据进行各种形式的组合,把数据的属性从数值转换成类别(或者反过来),亦或是对某一特征变量应用一个变形的函数。(比如,相比直接显示每一天的绝对数值,你可以利用这一天的数据除以一段时间内的平均值,来创造出可以展示相对概念的变量。)
Step 7: 模型的构建和评估——你应该要比较多个模型,以确定哪个模型对于你需要解决的问题能给出最合理的解释和结果。通过使用训练集和测试集对模型进行交叉验证,你可以看出哪一模型对预测结果准确率更高。同时你还应该特别注意如何去评估模型好坏,能够解释为什么你选择这些评估指标。
(例如比较一个随机森林、lasso回归和支持向量机回归模型来预测产品销量。)
Step 8: 将模型结果进行应用(Optional)——如果面试官看到候选人将她的模型投入运用进了一个真实的网页或API,这会让人印象很深刻。这表明候选人可以使用更高级的编程技术或编程包。我个人偏爱使用python,但是我也看到过其他人把R使用得炉火纯青。(例如在你可以创建一个R Shiny Project,通过对预测指标给予不同的假设来预测销量。)
Step 9: 回顾与展示——你需要回顾你做过的项目,看看在项目过程中遇到了哪些困难,通过什么方法解决,哪些地方可以做得更好,并不是所有项目都可以从始到终进行得很完美)这些都将是你在面试中回答行为问题的宝贵素材。我还建议你可以根据当前项目的发现和洞察来思考和开启下一个项目的主题。(例如我应该在这个分析中考虑如何自动化一些比较手动的流程,是否可以找到其他一些指标来提高模型准确率。)
如果你是“非计算机或者数学统计专业背景”的数据岗位求职者,那么就像上文所说的,你应该遵循以下步骤:
· 找对求职途径——找人内推,而不只是给HR投简历。
· 找准就业企业——去有着更多数据的公司,走上你的数据成长之路
· 找好学习方法——去学习一套完整的数据技能,做有针对性的数据项目。
CDA数据分析师按照CDA认证标准打造的《敏捷算法建模训练营》,完全符合一个优秀的项目的9大必备条件!携手全球领先的咨询公司首席数据科学家,真实还原企业常见的数据科学项目,致力于培养优秀的数据科学家!项目经历可放在简历上提升履历背景。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/go ...
2025-03-12以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-11随着数字化转型的加速,企业积累了海量数据,如何从这些数据中挖掘有价值的信息,成为企业提升竞争力的关键。CDA认证考试体系应 ...
2025-03-10