互联网和移动互联网时代,程序员成了公认的高薪工作,是众多企业的抢手人才。但凡大学专业沾边计算机的理科生,都有机会去竞逐一下互联网大厂的高薪岗位。
数据时代,数据人才就像之前的程序员成了企业的「香饽饽」,互联网大厂又开始招募大量数据岗位,根据《2020中国数字化人才现状与展望》报告显示,数据人才的需求在不断增加:
数据人才的岗位薪资也高于普通白领平均薪资:
面对这么大好的形势,这次难道没咱们文科生什么事情了吗?「我读的文科,我读的商科,我数学不好,我能学数据分析吗?」这也是我们被问的最多的问题之一。
其实文科生已经意识到自己的竞争对手会是数学好的理科生,所以他们的问题细化成两个就是:
· 如果不是计算机或者数学统计相关专业,他就不能做数据分析吗?
· 想转行数据分析师,应该学哪些技能或者编程语言?
我们根据服务过7万学生的经验,总结了三个关键,帮助文科、商科专业的学生成功找到数据好工作:
· 找对求职途径
· 找准就业企业
· 找好学习方法
进入一家公司一般有两种途径——常规的人力资源(HR)途径和内推途径。HR途径就是通过招聘人员、公司招聘网站、招聘系统,或者申请实习来找到工作;而内推途径则是通过招聘经理或者公司的现任员工来推荐申请工作。
HR途径上会根据硬性的专业要求、学历要求进行筛选,可能在你被面试之前,传统的HR途径因为你没有数学统计或计算机学位而剔除你。但在内推途径中,你通常能够直接地与决定是否录用你的人以及最终与你共事的人或团队打交道。
对于那些只拥有市场营销教育背景的求职者来说,获得一份数据科学家工作的最佳途径就是选择内推。
在BOSS直聘上以「数据」为关键词搜索,得到北京地区的前3226个热门岗位,我们可以看到:
3.1 最热门的岗位
数据分析师,是招聘职位里面最热门的,其次是大数据开发工程师、数据产品经理,说明在产品经理领域,数据的应用也是非常广泛。
3.2 薪酬水平
数据相关岗位的薪酬集中在月薪20-50K之间,部分高薪的可以到月薪50-100K,比如BOSS直聘就在北京以80-100K,16薪,招分布式存储计算平台专家,但要求是10年以上的工作经验,不要被这个工作经验吓到,看看接下来的统计。
3.3 工作经验的要求
我们可以看到工作经验的要求还是集中在1-3年,3-5年,其中经验不限的也占了较大比重,所以有志于从事数据行业的,可以大胆的尝试,这个行业很开放,另一个佐证就是下面的学历。
3.4 学历要求
本科是要求最多的,因此担心学历是不是必须要硕士的可以放心,数据告诉你:本科就满足大部分企业的要求。
3.5 招聘企业
从数据来看,在北京对于数据人才需求最大的企业是京东,接下来是滴滴、理想汽车。
3.6 最需要的技能
SQL、Python,数据分析,是这些数据岗位要求最多的技能。这些技能要怎么掌握,学习方法就至关重要了。
并不是所有想往数据方向发展的人都已经从事过数据相关的工作,但每个人都可以将自己曾经做过的数据相关的项目整理到一起,以此来展示自己在数据领域的工作能力。如果你做过一些很不错的项目,并且将它们展示在你的github或简历上,这将大大提高你找到工作的机会。
4.1 如何选择一个好的项目呢?
关于数据项目的选择,最重要的事情之一是它需要是非常有针对性且具有行业独特性。项目内容越具体、越紧密联系某个你感兴趣的行业,你就能越好地解释这个项目的意义。
选择的项目应该符合下列两个类别之一(或者两者都包括):
(1)这个项目是针对你想进入的某个行业或某份工作设计的——做这类项目可以证明你为什么要申请某个特定的职位。这还说明你对可能从事的领域已有了潜在的了解。
(2)这个项目对你来说是有趣的、有热情的——当你面试时,面试官谈论起这段经历,这一点热情就会变得很明显。当候选人对自己做过的项目感到自豪时,面试官是可以明显感受到候选人在被问到该项目时的那份激情的。
4.2 学习数据技能的最佳路径——「以终为始」的项目学习
你选择的项目应该大致遵循以下这样一个流程,并且在做完项目后你需要能够详细地描述当中的每个步骤。
Step 1: 解决一个实际数据问题——以终为始,课程的最后是怎么的项目?项目背景是什么?是出于什么原因要去做这个项目?(商业问题举例:希望通过历史数据评估营销渠道的效果,以此为明年的营销预算分配提供建议)
Step 2: 数据收集——好的项目要有数据收集的过程,既可以是直接从数据源下载数据集,或者是从某个渠道去使用API爬取。(例如使用python从Twitter上获取tweets相关的数据。)
Step 3: 数据清洗和聚合——这一步实在太重要了。没有这一步的项目都不是“贴合实际工作情况“的好项目。它是数据科学中最重要的一步。对数据格式的处理和清洗会对最终分析的结果产生非常大的影响。你需要通过项目去完全了解你在处理数据时做出决策的原因,比如如何处理缺失值,如何选择或提出某些变量特征,以及如何处理异常值等等。(例如某些天因为技术问题,无法收集到营销支出的数据。)
Step 4: 变量探索——这部分对于一个好项目来说也非常重要。因为在这部分分析中,你要去审视每一个变量的特点。你需要深入研究每个变量(或者叫特征)的分布,并评估这些特征之间的关系。为了显示这些关系,你需要使用诸如箱线图、直方图、相关性图等视觉效果。这一过程有助于告诉你哪些变量和数据可以帮助你解答你想要解决的商业问题。(例如显示每天不同渠道的营销费用的分布图,每天的平均花费。)
Step 5: 数据探索性分析——在这一步,你开始利用数据来探索趋势。可以使用数据透视表来了解变量和变量之间随着时间变化而变化的趋势。可视化的工具也应该在这一环节的分析中被大量运用。与前面一步非常相似,这一步也是帮助你来了解在模型中要放入哪些变量。(例如每个品牌每天的销量、营销支出与销售量之间的散点图,等等)
Step 6: 特征工程(或叫变量转换transformation)——这一步的分析非常重要(所以我将其单独列为一步),然而它通常应与数据分析(Step 5)同时进行。特征工程分为两种:
(1)创建可以提高预测准确性的新特征变量;
(2)改变数据的性质,使其更适合进行量化分析。好的项目会教你,在构建新特征变量时如何充分发挥创造性。你可以使用其他数据进行各种形式的组合,把数据的属性从数值转换成类别(或者反过来),亦或是对某一特征变量应用一个变形的函数。(比如,相比直接显示每一天的绝对数值,你可以利用这一天的数据除以一段时间内的平均值,来创造出可以展示相对概念的变量。)
Step 7: 模型的构建和评估——你应该要比较多个模型,以确定哪个模型对于你需要解决的问题能给出最合理的解释和结果。通过使用训练集和测试集对模型进行交叉验证,你可以看出哪一模型对预测结果准确率更高。同时你还应该特别注意如何去评估模型好坏,能够解释为什么你选择这些评估指标。
(例如比较一个随机森林、lasso回归和支持向量机回归模型来预测产品销量。)
Step 8: 将模型结果进行应用(Optional)——如果面试官看到候选人将她的模型投入运用进了一个真实的网页或API,这会让人印象很深刻。这表明候选人可以使用更高级的编程技术或编程包。我个人偏爱使用python,但是我也看到过其他人把R使用得炉火纯青。(例如在你可以创建一个R Shiny Project,通过对预测指标给予不同的假设来预测销量。)
Step 9: 回顾与展示——你需要回顾你做过的项目,看看在项目过程中遇到了哪些困难,通过什么方法解决,哪些地方可以做得更好,并不是所有项目都可以从始到终进行得很完美)这些都将是你在面试中回答行为问题的宝贵素材。我还建议你可以根据当前项目的发现和洞察来思考和开启下一个项目的主题。(例如我应该在这个分析中考虑如何自动化一些比较手动的流程,是否可以找到其他一些指标来提高模型准确率。)
如果你是“非计算机或者数学统计专业背景”的数据岗位求职者,那么就像上文所说的,你应该遵循以下步骤:
· 找对求职途径——找人内推,而不只是给HR投简历。
· 找准就业企业——去有着更多数据的公司,走上你的数据成长之路
· 找好学习方法——去学习一套完整的数据技能,做有针对性的数据项目。
CDA数据分析师按照CDA认证标准打造的《敏捷算法建模训练营》,完全符合一个优秀的项目的9大必备条件!携手全球领先的咨询公司首席数据科学家,真实还原企业常见的数据科学项目,致力于培养优秀的数据科学家!项目经历可放在简历上提升履历背景。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31