第十届CDA数据分析师认证考试,在2019年6月底圆满地落下了帷幕。
之前我们采访了CDA认证考试 Level 1中的几位优秀考生,为大家分享了他们备考中的心路历程。
今天我们带来的是Level 2 大数据和建模方向中取得优异成绩的几位考生,他们当中有学校在读的研究生,有入职不久的职场新人,还有经验丰富的数据工作者,那么他们有怎样的备考心得体会呢?
下面让我们来一睹他们的风采吧!
LEVEL Ⅱ 大数据分析师
更多考试介绍及备考福利请点击:CDA 认证考试中心官网
希望今后能继续在大数据行业做些有趣、有意义、有价值的东西出来。
1.目前从事的工作
我目前在江苏欣网视讯软件技术有限公司工作,主要从事电信行业相关的大数据分析和产品开发。
2.报考CDA认证考试的契机
当时我们公司鼓励员工报名参加CDA考试,我看了大纲后发现CDA二级大数据分析师的考试内容相当实用,与当前工作经常用到的大数据知识非常接近,就果断报名了。
3.数据科学零基础的我是如何备考的
我在5月31日报名,大概备考了4周时间。学习计划一般每天是下班回家后学习1-2小时左右。
先跟据考纲要求,把所有考试内容系统的过了一遍。对于本来就常用的一些内容,例如Hadoop生态圈的知识,简单的复习就够了。
对于了解不够深入的内容,例如数据挖掘和机器学习方面,就查找相关资料,定点突破。
4. 备考中有哪些知识难点
Spark的基础原理,RDD、GraphX和MLlib都是有一定难度的,尤其是MLlib部分,对于数据挖掘和机器学习方面还要有一些了解。
5.推荐的书籍和课程
首先就是伴随着众多人进入Hadoop世界的《Hadoop权威指南》,该书也是CDA考试推荐的必读书目,目前最新版本为第四版。
另外,可以结合林子雨教授的视频课程《大数据原理与应用》来共同学习,效果更佳。
如果觉得不过瘾,还想深入了解,推荐《Hadoop应用架构》,该书站在架构的高度,详细阐释了Hadoop生态圈诸多工具如何相互配合,形成各种大数据分析场景的完整建设方案。
Spark学习推荐同样是O’Reilly出品的《Spark快速大数据分析》,该书对Spark的构架和相关组件作了细致的描述,也是迈入Spark分析领域的基础指南。只是该书完成较早,Spark 2.x版本尚未发布,部分考纲内容尚未覆盖。
所以建议同时阅读林子雨教授编著的《Spark编程基础》,并结合配套的林教授的视频课程《Spark大数据处理技术》,林教授的书和课程对Spark MLlib的讲解和描述非常详尽,非常值得一看。
6.对备考者们的建议
对于正在从事大数据行业,尤其是Spark相关工作的同学来说,由于考试内容相当实用,备考内容不少就是平时的工作内容。所以不用太紧张,跟着大纲过一遍,回顾下自己熟练掌握的内容,重点学习不够了解的内容,把握重点,定点突破。
对于打算从事大数据分析的同学,CDA也是一个很不错的进入大数据世界机会。建议按照考纲推荐的图书,有计划地进行系统性、有深度的学习。知其然,更要知其所以然。
另外要知道,大数据是一个实用性很强的行业,学习理论的同时一定要多动手。从基本的Linux安装、Hadoop分布式搭建,扩展到Hadoop生态圈Hive、HBase、Flume、Spark等项目的部署和使用,都自己动手试试,多踩坑才能学的更多更深。
7.今后的职业发展规划
希望能和公司同事一起,共同努力,在大数据行业做些有趣,有意义,有价值的东西出来。
LEVEL Ⅱ 建模分析师
更多考试介绍及备考福利请点击:CDA 认证考试中心官网
学校学习的理论知识往往是不够的,我想以技能傍身,通过CDA认证考试加强自身的学习。
1.报考CDA认证考试的契机
我是安徽大学应用统计专业研一的学生。我本科也是统计学专业,从本科到研究生看着统计学专业日益火爆,在统计学越来越热门的当今,自己的能力要能匹配专业的发展速度。而学校学习的理论知识往往是不够的,所以想要以技能傍身,通过考证加强自身的学习。
由于研一上半学期接触到了数据挖掘加上导师也是数据挖掘方向,导致自己对数据挖掘、机器学习很感兴趣,刚好了解到CDA Level 2建模分析师的考试重点刚好是数据挖掘算法和软件实操,因此决定报考。
2.我是如何备考的
由于是学生,我的时间比较充裕,考虑到自身对软件的熟练程度不够而CDA L2能否通过就取决于实操,所以3月份学期刚开学就首先投入到软件的学习中。
(本人对R软件有一定的基础就选择了R)我的备考之路分为四个阶段:
一、语言(软件)的学习
实操的重要性刚才已经提到,选择一个数据分析软件或拿手的一门语言(R/Python)保证熟练操作。这个阶段需要贯穿整个备考时期。
二、考纲重点的学习
在我了解了考纲后,将考试重点分为数据的预处理和算法建模两大块,由于我是统计专业,深刻了解数据预处理的重要性,对这部分考纲知识点有一定的基础,就把重点放在算法建模上,有针对性的看算法书一个一个攻克算法,准备时间大概为1个月。
三、查缺补漏
在攻克了重难点以后,需要对所有知识点进行查缺补漏,最好的办法就是完整性的看书,我将《数据挖掘导论》看了两遍,对知识点进行补充。
四、冲刺视频
在看完考纲和课本之后通过冲刺视频进行考点的梳理,将思维拉回到考试线上,做好笔记,反复回忆,对提及的操作题反复练习,做好考试准备。(复习时间为1个月)
3. 备考中有哪些知识难点
对于我来说,分类问题模型评估的阈值确定是一个难点。因为之前在学校几乎没有接触过这种调节阈值的问题,通过这次考试了解到了类不平衡问题阈值的调节,通过F值确定阈值以及通过profit确定阈值的方法。
4.推荐的书籍和课程
书籍要紧靠大纲,我是以《数据挖掘导论》为主,《机器学习》为辅。
在考试前了解到CDA考前冲刺课,在看完至少一遍大纲和课本,对知识点有了了解之后再反复看视频,对知识点进行梳理就会感觉很清晰。
5.对备考者们的建议
一、实操不能掉以轻心,实操的学习是不断积累的过程,熟能生巧。
二、考证不是目的,通过考证真正去学习知识,学以致用才是目的。
三、由于我备考过程中也认识了许多边工作边考证的姐姐哥哥们,对于这类考生,没有大量的时间,建议选择适合自己的数据分析工具。
四、加入数据分析备考群已获得最新考试动向,避免独战。
6.今后的发展规划
数据分析已经成为必不可少的技能,我希望将所学的数据分析、数据挖掘的知识应用在以后从事的职业中。
更多考试介绍及备考福利请点击:CDA 认证考试中心官网
作为一名建模分析师,我想通过考Level 2 帮自己梳理下学过的知识。
1.目前从事的工作
目前毕业一年多,学生期间正好是统计相关方向专业的。现在是一名建模分析师,日常工作与数据比较相关。
2.报考CDA认证考试的契机
读研的时候在经管之家论坛有看到,机缘凑巧报了Level 1的考试。今年正好工作有变动,想找个时间梳理下学过的知识,就报了Level 2的考试。
3.我是如何备考的
六月初开始看的,四周左右的时间,每天复习时间大概下班后三小时以及周末时间。
选择题的部分根据考纲和解析,配合《数据挖掘》、《数据挖掘导论》梳理知识点;实操题的部分我用的是R,把考纲里提到的方法都动手实践一遍。
4. 备考中有哪些知识难点
模型评估的部分涉及多种评价指标涉及范围广,不少是较小众的,相关材料较难找到,每个指标具体统计口径计算方式难以确定,具体考试实践也比较灵活。
5.推荐的书籍和课程
就我自己的经历与学习过程,我推荐以下几本书:
·《统计学习导论》这本是ESL入门版,可以基于R语言动手实践;
· 李航博士的《统计学习方法》,今年出了第二版,算法理论部分讲的很透彻;
·《百面机器学习》,覆盖大多数算法的具体操作,包括很多应用上的细节。
6.对备考者们的建议
CDA一级二级考察的知识范围对于数学或统计专业的学生应该并不陌生,考试本身也是一个比较好的系统性梳理所学专业知识的机会。
备考主要还是以考纲解析内容为主,配合参考书来看,遇到不懂的内容多翻书多上网。实操要注意在数据前期的预处理、特征工程上多了解多实践,不要仅局限于实践算法。
7.今后的发展规划
工作上做好本职工作,听从领导安排,注意总结累积业务知识;专业上提升工具使用上的熟练度,关注前沿知识,学习新的算法与工具。期望能立足岗位,学以致用。
更多考试介绍及备考福利请点击:CDA 认证考试中心官网
通过备考CDA认证考试,我希望进一步建立自己的数据分析和机器学习知识体系。
1.目前从事的工作
2006年研究生毕业后进入中兴,先后从事了路由器产品软件开发,各制式无线4G、5G产品的质量管理和过程改进。
随着公司数字化程度越来越高,devops的全面推进,就需要从大量的数据中挖掘价值,进行产品质量改进和过程改进。
2.报考CDA认证考试的契机
我在日常的工作中,主要有两大类数据要分析。一类是项目研发过程数据,另一类是产品的KPI数据。
从最早的excel,到mintab,以及6sigma分析方法,再到利用python做更大量的数据分析,使大数据分析可持续化、自动化嵌入研发流程。为了能最大化的挖掘数据隐藏价值,需要系统的学习KDD的数据挖掘方法,才能更全面地抽象和建立数据模型,一方面提升产品的版本稳定性,提前预测和修复问题,另一方面使质量管理上一个新的台阶,提供更可靠的决策支持。
基于此目标,我希望通过CDA的学习,进一步建立自己的数据分析和机器学习知识体系。
3.我是如何备考的
1)大纲为准,补充知识盲点,建立知识框架。
备考时一定要紧密联系大纲,根据大纲的内容和知识点进行查漏补缺,逐步建立自己的知识框架。这是备考中不可或缺的大前提,只有基础打好了,才能更好地进行之后的学习。
2)案例为本,解决实际问题。
先结合小的案例学习python语言,能够将原来用excel做的图表通过python实现,有了python基础,就结合scikitlearn网站做复杂的算法和实现。因为我的目标是要解决实际工作中遇到的问题,所以,学习过程是以案例为主,认证通过是个水到渠成的过程。
3)多管齐下,取长补短,了解差异。
熟悉excel,mintab,spss,python等不同方式分析的差异和优劣,选择最合适快捷的方式,提高效率的同时,深刻的了解工具差异优劣。
4. 备考中有哪些要注意的地方
1)首先要理解案例题的意图,先想清楚业务逻辑,再做数据预处理,选择合适的模型。
2)同时还要能够对模型进行调参,来保证更优的处理结果,毕竟案例题是按排名给分的哦。这就要深入理解算法原理和模型评价指标。
5.推荐的书目
· 《数据挖掘导论》
· 《机器学习》
· 《利用python进行数据分析》
· 《备考手册》
6.对备考者们的建议
1)大纲一定要吃透,理解每一个字,每一个例题。
2)学会一个个算法和模型容易,什么时候用哪个,怎么用,有什么限制得理解清楚。
3)数据处理要谨慎,不能想当然。记住GIGO原则。
4)考前冲刺,区分概念差异,强化算法的简单手算能力。
7.今后的发展规划
通过数据挖掘,机器学习相关的方法应用,做更加专业的数据挖掘和预测分析,针对不同的项目诉求,提供产品改进方案和结果评估。让数据发声,产生价值,提供专业的管理和决策支撑。
更多考试介绍及备考福利请点击:CDA 认证考试中心官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“用户旅程分析”概念 用户旅程图又叫做用户体验地图,它是用于描述用户在与产品或服务互动的过程中所经历的各个阶段、触点和情 ...
2025-01-22在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-22在数据分析领域,Excel作为一种普及率极高且功能强大的工具,无疑为无数专业人士提供了便捷的解决方案。尽管Excel自带了丰富的功 ...
2025-01-17在这个瞬息万变的时代,许多人都在寻找能让他们脱颖而出的职业。而数据分析师,作为大数据和人工智能时代的热门职业,自然吸引了 ...
2025-01-14Python作为一门功能强大的编程语言,已经成为数据分析和可视化领域的重要工具。无论你是数据分析的新手,还是经验丰富的专业人士 ...
2025-01-10完全靠数据决策,真的靠谱吗? 最近几年,“数据驱动”成了商界最火的关键词之一,但靠数据就能走天下?其实不然!那些真正成功 ...
2025-01-09SparkSQL 结构化数据处理流程及原理是什么?Spark SQL 可以使用现有的Hive元存储、SerDes 和 UDF。它可以使用 JDBC/ODB ...
2025-01-09在如今这个信息爆炸的时代,数据已然成为企业的生命线。无论是科技公司还是传统行业,数据分析正在深刻地影响着商业决策以及未来 ...
2025-01-08“数据为王”相信大家都听说过。当前,数据信息不再仅仅是传递的媒介,它成为了驱动经济发展的新燃料。对于企业而言,数据指标体 ...
2025-01-07在职场中,当你遇到问题的时候,如果感到无从下手,或者抓不到重点,可能是因为你掌握的思维模型不够多。 一个好用的思维模型, ...
2025-01-06在现代企业中,数据分析师扮演着至关重要的角色。每天都有大量数据涌入,从社交媒体到交易平台,数据以空前的速度和规模生成。面 ...
2025-01-06在职场中,许多言辞并非表面意思那么简单,有时需要听懂背后的“潜台词”。尤其在数据分析的领域里,掌握常用术语就像掌握一门新 ...
2025-01-04在当今信息化社会,数据分析已成为各行各业的核心驱动力。它不仅仅是对数字进行整理与计算,而是在数据的海洋中探寻规律,从而指 ...
2025-01-03又到一年年终时,各位打工人也迎来了展示成果的关键时刻 —— 年终述职。一份出色的年终述职报告,不仅能全面呈现你的工作价值, ...
2025-01-03在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-03在数据分析的江湖里,有两个阵营总是争论不休。一派信奉“大即是美”,认为数据越多越好;另一派坚守“小而精”,力挺质量胜于规 ...
2025-01-02数据分析是一个复杂且多维度的过程,从数据收集到分析结果应用,每一步都是对信息的提炼与升华。可视化分析结果,以图表的形式展 ...
2025-01-02在当今的数字化时代,数据分析师扮演着一个至关重要的角色。他们如同现代企业的“解密专家”,通过解析数据为企业提供决策支持。 ...
2025-01-02数据分析报告至关重要 一份高质量的数据分析报告不仅能够揭示数据背后的真相,还能为企业决策者提供有价值的洞察和建议。 年薪 ...
2024-12-31数据分析,听起来好像是技术大咖的专属技能,但其实是一项人人都能学会的职场硬核能力!今天,我们来聊聊数据分析的核心流程,拆 ...
2024-12-31