cda

数字化人才认证
为什么学习商业策略+数据挖掘

以 CDA 认证的 LEVEL II 和 LEVEL III 大纲为核心,目标培养同时具有策略优化和数据挖掘能力的全栈数据挖掘人才,而非只懂“调算法包,跑代码”的单一技能程序员。

课程内容兼顾培养每位学员的双向技能,既有解决数据挖掘流程问题的横向能力,又有解决数据挖掘算法问题的纵向能力。

数据挖掘流程问题的横向能力要求学备从数据治理根源出发的思维,通过数字化工作方法来探查业务问题,通过近因分析工具、宏观根因分析等手段,再选择业务流程优化工具还是算法工具,而非“遇到问题调算法包”。

数据挖掘算法纵向能力要求学生在使用算法解决微观根因分析、预测分析的问题上,根据业务场景来综合判断,洞察数据规律,使用正确的数据清洗与特征工程方法,综合使用统计分析方法、统计模型、运筹学、机器学习、深度学习、文本挖掘算法,而非单一的机器学习算法。

数据挖掘工程师的职业优势

数据挖掘算法方向,是目前IT互联网行业热门的职业方向,国内数据挖掘人才的招聘市场,不管是现阶段还是未来的至少五年到十年内,都持续保持供不应求的状态。

数据挖掘工程师专注于用数据挖掘算法为企业挖掘数据中的金矿,为决策分析和预测分析提供强有力的支持,是提升企业核心竞争力的关键人才。

数据挖掘工程师遍布互联网、电商、搜索、社交等众多热门行业,未来的人工智能、自动驾驶领域也将是数据挖掘工程师的舞台,学会数据挖掘的你,也将是优秀企业最需要的数字化人才。

数据挖掘工程师课程标准如何成为具有高商业价值的全栈数据挖掘工程师?
就业技能
集训课程
讲师+助教+
班主任陪伴式学习
跨行业,跨场景,培养具有核心
竞争力全能型数据分析师
学习曲线平缓,学习难度适中
能力稳步提升
测讲练评
定期作业与测评
独立设立教学监督组
即时教学质量监督
世界500强企业项目实战
提升综合实战能力
课程大纲
  • 数据治理基础
  • 数字化工作方法
  • 数据采集方法
  • Python编程基础
  • Python数据探索、数据处理与可视化
  • Python探索分析综合案例
  • Pythont统计分析与运筹学基础
  • 数据分析模型、算法与商业应用
  • 标签体系与应用
  • 数据挖掘概论
  • 高级数据处理与特征工程
  • 机器学习算法与应用(一)
  • 机器学习算法与应用(二)
  • 机器学习算法与应用(三)
  • 机器学习实战
  • 自然语言处理
  • 行业综合项目实战
  • 数据分析师职业规划
  • 面试技巧一对一辅导
  • 项目实战选修
数据治理基础 课时:6
主要内容

数据治理驱动因素、数据治理域、数据管理域、数据应用域、如何开展数据治理

可解决的现实问题

解决企业数据治理问题,理清企业数据逻辑,提高企业数据质量与价值

可掌握的核心竞争力

领会数据分类中的主数据、交易数据和元数据概念;理解数据库建模中概念、逻辑、物理模型之间的关系;掌握数据治理方法与方向

数字化工作方法 课时:6
主要内容

EDIT数字化模型简介、业务探查(E)、问题诊断(D)、业务策略优化和指导(I)、算法工具介绍(T)

可解决的现实问题

解决企业数据采集,数据模型构建,搭建数据之间的逻辑

可掌握的核心竞争力

领会数据分类中的主数据、交易数据和元数据概念;理解数据库建模中概念、逻辑、物理模型之间的关系;领会数据库范式的概念、数据仓库和数据集市、ETL过程;掌握关系模型与维度模型的使用场景

数据采集方法 课时:3
主要内容

数据采集方法、数据模型管理

可解决的现实问题

解决企业数据采集,数据模型构建,搭建数据之间的逻辑

可掌握的核心竞争力

领会数据分类中的主数据、交易数据和元数据概念;理解数据库建模中概念、逻辑、物理模型之间的关系;掌握关系模型与维度模型的使用场景

Python编程基础 课时:18
主要内容

Python标准数据类型、控制流语句、自定义函数、异常和错误、类与面向对象编程、Python连接数据库操作、Python编程面试题集训

可解决的现实问题

解决使用商业智能报表分析业务、监控业务的问题

可掌握的核心竞争力

具备Python代码编写阅读能力; 掌握基本的Python语法;熟悉面向对象的原理;掌握Python数据库编程;

Python数据探索、数据处理与可视化 课时:18
主要内容

Numpy数组基础操作、Pandas数据表的基本操作、Pandas数据探索、Pandas数据可视化、Python数据可视化包-Matplotlib介绍、Python数据可视化包-Seaborn介绍与图形绘制

可解决的现实问题

完成企业实际工作中的数据清洗、转换等数据加工及可视化任务,为后续机器学习打下基础

可掌握的核心竞争力

掌握数据清洗的方法与技巧;掌握数据常用可视化的方法与技巧

Python探索分析综合案例 课时:12
主要内容

实战案例:斯德哥尔摩气候可视化分析、餐饮订单数据清洗与分析、文本数据分析之QQ聊天记录可视化分析

可解决的现实问题

实际项目检验学习成果,学以致用,更加贴近实战项目,达到学习价值

可掌握的核心竞争力

掌握Python综合使用技能,掌握numpy与pandas的用法

Pythont统计分析与运筹学基础 课时:18
主要内容

先导课:抽样方法、统计量及抽样分布、参数估计与假设检验、统计分析与Python实战、线性规划与二次优化; 实战案例:关于饮料消费的统计学分析、快递公司的路线策略优化

可解决的现实问题

使用统计分析和运筹学的基础知识来解决与企业策略优化相关的问题,比如快递路线优化问题、商品价格定价策略问题等等。

可掌握的核心竞争力

熟悉常见统计分布的特点与应用;熟悉假设检验的基本概念与方法;掌握T检验、方差分析的方法步骤;掌握线性规划与二次优化

数据分析模型、算法与商业应用 课时:18
主要内容

数据分析方法论介绍、方差分析、回归分析、分类数据分析、逻辑回归、数据降维、时间序列分析、实战案例:金融客户行为特征分解与营销策略优化、汽车行业销售预测与经营战略优化、基于广义线性模型的汽车保险分类定价策略的优化、收益率的系列预测、基于时间序列的机

可解决的现实问题

可完成电商、金融、互联网等行业的用户行为分析与预测,商业策略分析等工作。

可掌握的核心竞争力

熟悉数据分析方法与步骤;掌握方差分析与应用,回归分析与应用,分类数据分析方法,时序数据的分析预测方法

标签体系与应用 课时:6
主要内容

用户标签体系设计原理、用户标签的制作方法、标签体系的用户画像应用、实战案例:用户行为在营销活动的价值分析、自动预警指标推送功能框架的搭建、app静默用户触动分析

可解决的现实问题

可完成电商、金融、互联网等行业的标签体系的设计与应用任务。如构建业务指标体系、构建用户画像等高价值工作。

可掌握的核心竞争力

掌握用户标签体系设计原、熟悉用户标签的制作方法、熟悉用户画像的应用

数据挖掘概论 课时:6
主要内容

数据挖掘概要、数据挖掘方法论、基础数据挖掘技术、进阶数据挖掘技术

可解决的现实问题

理解和辨别数据挖掘算法在企业不同的工作场景中的应用,

可掌握的核心竞争力

熟悉数据挖掘的基本理论与技术

高级数据处理与特征工程 课时:12
主要内容

特征工程概要、特征建构、特征选择、特征转换、特征学习

可解决的现实问题

正确理解特征工程,为提高模型效果,正确使用特征工程方法做准备

可掌握的核心竞争力

熟悉特征工程概念与原理;掌握特征工的构建,特征工的选择、转换

机器学习算法与应用(一) 课时:24
主要内容

KNN-最近邻分类算法:原理、实现、决策树(分类树及回归树)、聚类分析

可解决的现实问题

本阶段课程学习基础机器学习算法,有分类算法与聚类算法。这些算法可应用在大部分的商业问题中:如信用评分、客户画像等。

可掌握的核心竞争力

掌握KNN算法原理与基于Python的应用;掌握决策树算法原理、scikit-learn应用以及算法优化技巧;掌握K-means聚类算法原理及应用;熟悉保险行业客户分群意义;掌握决策树算法在客户分群中的实际运用;

机器学习算法与应用(二) 课时:30
主要内容

朴素贝叶斯、神经网络与深度学习、支持向量机、集成方法 实战案例:航空客户价值分析综合案例、基于集成算法的乳腺癌疾病预测、基于神经网络的汽车燃油率预测

可解决的现实问题

本阶段课程学习高阶机器学习算法与集成算法,这些算法在企业内的应用也比较多,如客户流失预警、动态定价、客户细分、欺诈检测、垃圾邮件检测、图像分类与识别等。

可掌握的核心竞争力

掌握朴素贝叶斯算法原理与应用;掌握常见神经网络算法的原理与应用;掌握SVM算法原理与应用,常见集成算法的原理;熟悉xgboost 、LightGBM算法原理;通过案例熟悉相关行业背景知识,并熟练运用算法;

机器学习算法与应用(三) 课时:12
主要内容

关联规则、序列模式、模型评估、实战项目:推荐系统实战

可解决的现实问题

掌握推荐系统主要的算法,并能依据模型结果提供实际营销建议。

可掌握的核心竞争力

掌握关联规则的核心原理与应用;掌握序列算法的原理及应用; 熟悉模型评估算法;掌握模型评估算法原理及应用

机器学习实战 课时:12
主要内容

实战案例:以自动机器学习技术开发银行业信用风险评分模型并进行最佳模型调参、以类别不平衡处理技术开发银行业中小企业信贷营销模型并进行最佳模型调参、以半监督式学习技术开发电信业客户流失模型并进行最佳模型调参

可解决的现实问题

可完成电商、金融、互联网等行业中的分类、预测问题,如用户购买预测、垃圾邮件检测、商品精准推荐等等。

可掌握的核心竞争力

掌握自动机器学习原理;熟悉类别不平衡问题的解决方法;掌握半监督学习算法原理与应用,模型优化技巧

自然语言处理 课时:30
主要内容

自然语言处理概要、分词与词性标注、文本挖掘概要、关键词提取

可解决的现实问题

可解决工作中自然语言处理相关问题,如舆情监控、用户情感分析、语义分析、KOL画像等工作。

可掌握的核心竞争力

熟悉自然语言处理的基本概念;掌握分词以及词性标注技术,文本挖掘技术流程方法,信息检索技术

行业综合项目实战 课时:24
主要内容

实战案例:金融信用评分卡风控建模综合项目实战、以特征工程技术开发文本情感分析模型、以深度学习技术开发银行业信用卡盗刷侦测模型、以图像处理技术、深度学习及迁移学习技术,开发人脸口罩侦测模型

可解决的现实问题

通过课程的学习,能完成评分卡建模、情感分析模型构建、信用卡盗刷侦测相关工作能力 。

可掌握的核心竞争力

综合使用机器学习、深度学习、自然语言处理算法来解决金融、银行、AI科技等行业的场景应用。

数据分析师职业规划 课时:12
主要内容

职业规划、职场沟通力、团队协作力培养

可解决的现实问题

了解职业现状和前景,解决职业沟通和团队协作问题

可掌握的核心竞争力

专职职业导师培养职业规划、职场沟通、以及团队协作能力。

面试技巧一对一辅导 课时:预约
主要内容

1V1面试技巧指导、简历修改

可解决的现实问题

解决面试技巧不足、简历书写不专业问题

可掌握的核心竞争力

专职就业老师1V1面试技巧辅导与简历修改指导。

项目实战选修 课时:46
主要内容

何为数据产品经理?Python爬虫、Python办公自动化、数据挖掘项目选修项目

可解决的现实问题

解决学员在不同数据岗位方向和行业方向的业务经验和项目经验不足的问题。

可掌握的核心竞争力

根据学员面试方向、就业方向来选择合适的选修课程来进一步进修。

适合人群
零基础入门

对口专业,高校数据科学、
统计相关专业在校生

在职提升

职场晋升,从事数据相关岗位,
遇到职场晋升瓶颈

转行就业

计算机相关
专业转行人群

数据钻研

喜欢钻研
数据科学的人群

数据分析师职业发展路径
真项目由专职教研团队精心设计研发,丰富的跨行业实战项目,帮助你快速进阶
  • 全行业
  • 全流程
  • 全名师
  • 全体系
  • 真案例
  • 高标准

涵盖行业中的各个场景,运用自动机器学习技术、类别不平衡处理技术、半监督式学习技术、特征工程技术、深度学习技术、图像处理技术、
深度学习及迁移学习技术等前沿挖掘模型,处理风控、信贷、客户流失、情感分析、人脸侦测等广泛的行业应用.

银行业信用风险评分模型

以自动机器学习技术开发银行业信用风险评分模型并进行最佳模型调参案例本项目将介绍如何将机器学习中的数据预处理、特征选择、算法选择、模型优化等步骤,将其放在一个“黑箱”里,通过黑箱,我们只需要输入数据,就可以得到我们想要的模型预测结果。学习并掌握自动机器学习的模型建构方法,并以银行业信用风险评分为例,进行信用风险评分模型的自动化。

中小企业信贷营销模型

以类别不平衡处理技术开发银行业中小企业信贷营销模型并进行最佳模型调参案例本项目将介绍多个类别不平衡的处理方法,以有效地对少数类别做正确的预测,帮助组织制定适当的决策,并节省许多成本与损失。学习并掌握多个目标类别分布不平衡的处理方法,并以银行业中小企业信贷营销为例,进行信贷营销模型的开发。

电信业客户流失模型

以半监督式学习技术开发电信业客户流失模型并进行最佳模型调参案例,本项目将介绍多个半监督式学习的方法,从未标记目标字段的数据中,找出一些模型比较有把握的预测结果当作目标字段的标记,以提升整体分类模型的预测效能。

文本情感分析模型

本项目将介绍多个特征工程的技术,从原始数据中,构建、提取、并选择好的特征,并建置一个文本情感分析预测模型。学习并掌握多个特征工程的技术,并以文本情感分析预测为例,进行情感分析预测模型的开发。

银行业信用卡盗刷侦测模型

本项目将通过利用信用卡的历史交易数据,进行机器学习,构建信用卡反欺诈预测模型,提前发现客户信用卡被盗刷的事件。学习并掌握常见信用卡盗刷的种类及信用卡盗刷的侦测的方法。学习信用卡盗刷的业务逻辑,发现关键业务结点,并掌握深度学习的建模能力。

人脸口罩侦测模型

本项目将以图像处理技术并结合深度学习及迁移学习,开发人脸口罩侦测模型。学习并掌握图像处理、深度学习及迁移学习的技术,并以人脸口罩侦测为例,进行人脸口罩侦测模型的开发。

解析数据分析业务全流程 厘清数字化人才技能需求

课程讲师均为国内数据挖掘领域、人工智能领域、咨询领域一线专家,具备深厚的学术背景与行业经验。
同时他们也都具备丰富的讲课经验,累计讲课经验时长超过10000小时,授课能力得到长期实践与验证。

常国珍

北京大学会计学博士 ThoughtWorks中国金融首席数据科学家 中国大数据产业生态联盟专家委员会委员 反洗钱模型专家

赵卫东

东南大学博士,复旦大学博士后 负责本科生、研究生大数据核心技术和商务数据分析等课程的教学。 商务智能被评为上海市精品课程,荣获2013年高等教育上海市教学成果奖二等奖。

董轶群

计算机软件与理论硕士,吉林大学计算机体系结构博士 具有多年JAVA程序设计和操作系统教学经验。 研究方向为智能规划、空间推理、基于大数据的时空信息系统。

赵老师

北京邮电大学管理科学与工程硕士 现就职于北京电信规划设计院, 从事移动、联通集团及各省分公司市场、业务、财务规划,经济评价及运营咨询。 重点研究方向包括离网用户挖掘,市场细分与精准营销,移动网络价值区域分析,潜在价值客户挖掘等

李御玺

台湾铭传大学教授、中华数据挖掘协会理事、台湾大学博士 国科会与教育部多个相关研究计划的主持人。 厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问,IBM SPSS-China顾问。服务过的客户包括:中国工商局、中信银行、台新银行等。发表研究论文超过260篇以上。

叶老师

东北大学基础数学专业,硕士研究生 近8年来,一直从事金融、电信行业数据架构、数据治理和数据分析挖掘方面工作。现任北京捷报金峰数据技术有限公司产品&技术总监,主要负责公司数据治理解决方案的建设、数据治理配套平台的研发,以及银行业数据治理应用场景的研究,该项目在17年获得北京市创新项目资金资助。

李奇

微软Excel MVP(Excel最有价值专家)/经管之家签约讲师/中国电子表格应用大会主席 曾在IBM中国担任销售管理团队数据分析项目组长及德勤北京所的数据分析高级咨询顾问。专精于企业数据分析、设计及实施商业智能业务解决方案、软件开发及SQL、Excel相关数据分析课程培训等。

丁老师

南京上度咨询数据分析总监 人大经济论坛数据处理中心数据分析顾问,SAS、SPSS 软件讲师、中国学习路径图国际中心技术顾问。曾参与2012 国家宏观经济预测、中国城镇居民家庭投资调查、泸州老窖目标管理与绩效考核、中国卫生状况调查、江苏广电 CRM 数据挖掘等大型数据处理项目。

董四辈

每日优鲜大数据高级算法架构师 曾任搜狗地图开发经理,当当网高级架构师,现任每日优鲜大数据高级算法架构师。十多年互联网从业经理,多次在互联网技术大会上交流分享项目经验与独特见解,对互联网项目的落地实施具有丰富的经验。

王小川

博士,国内某券商研究所高级分析师。神经网络,数据挖掘,统计分析应用领域专家,国内最大的MATLAB论坛管理员,曾多次参与The MathWorks 公司培训活动。

梁老师(九屠)

曾就职于阿里巴巴,饿了么,集团首席数据架构师,P10科学家。负责饿了么、百度外卖的大数据技术统筹。2014年加入百度,先后带团队建设为百度地图6大place场景做数据分析,后专注于百度外卖大数据

张志琦

德勤高级咨询顾问/创业公司数据科学家 经验涉及快消、通信、互联网餐饮、银行等多个领域的咨询项目; 涉及短视频、电商、数据平台等多个领域的投资尽调项目; 涉及快消、品牌商领域的数据建模项目,如智能定价、精准推荐、选品等。 专精于企业业务数据分析、数据可视化、制定及实施商业智能业务解决方案。

徐杨

Glasgow大学计量经济学博士,曾就职中国社科院、中国银行、北京工业大学从事算法研发工作。 师从Hisayuki Yoshimoto,主攻空间计量方向,对各种回归模型和联立方程模型有深入研究。 博士研究课题为神经网络的空间矩阵工具变量参数识别。 曾参与多个经济数据分析项目,其中纽约市场对香港市场高频交易分析项目已在英国上线。

唐绍祖

CDA数据科学研究院SQL与Python课程讲师 擅长Python、SPSS Modeler 等工具进行数据挖掘,参与主编《SPSS Modeler+Weka数据挖掘从入门到实战》等书籍

倪向洋

CDA数据科学研究院大数据课程讲师 曾就职于IBM系统运维工程师,有丰富的运维工作和大数据平台搭建经验,主要负责大数据平台搭建及数据化运维

张彦存

CDA数据科学研究院讲师,CDA在线助教, 主要研究方向为机器学习技术以及基于大 数据架构的数仓技术。

赵娜

AI项目组分析师、CDA在线助教,计算机专 业。精通excel、powerBI、 python、R语 言等数据分析常用工具。

陈丕昊

CDA在线助教,熟悉Python基础、Python 数据清洗等,在课程内容以及软硬件技术 拥有丰富的经验。

课程依据大量不同行业、不同岗位的企业内训需求,结合主流的数据体系进行课程研发,课程内容更符合市场需求

课程的底蕴来自企业的信赖,上百家企业需求提炼,课程更贴合企业诉求。
自2015年以来,我们已为超过百家企业提供了内训服务,见证了企业从数据分析中实现真正价值的全过程,越来越多的企业要求全员掌握数据化思维,对数据人才需求十分迫切。

课程大纲依据 CDA 的 「EDIT数字化人才模型」设计研发。CDA是数据人才认证标准,在国内由中成协大数据专业委员会监管
并是经国标委发布认定的数据分析师人才标准

认证设计理念创新 EDIT数字化人才模型
E-探索 指标体系
D-诊断 性质分析法、数量分析法
I-指导 知识库、
策略库、流程模板
T-工具 数据模型、
算法模型、优化模型

该模型体现层次和纵深两个方面
层次方面:强调战略、管理、操作三个层级的业务部门人员均借助数据支持创造性的优化业务流程。 纵深方面:以数据使用区分企业的前、中、后台,数据用户即业务人员,数据加工者即技术人员。

教研团队考核课程教学、学员服务、教学监督,三者相互配合,确保业内领先的面授质量
课程品质课程体系专业水准、授课老师「教授级」水平,做课我们更用心

专业度
师资
授课形式
讲师经验

课程内容
课程体系

内容覆盖理论
内容覆盖行业
项目课
课程迭代
学习效果

其他就业班

IT培训机构临时开设课程

本科IT程序员为主

视频自学,有惑难解

以软件开发经验为主,与数据科学相关性不大
无授课经验或IT开发授课经验为主

工具堆砌

课程内容东拼西凑不成体系

机器学习为主

互联网企业为主

视频自学与视频直播为主

视频自学一年,不敢面对岗位

数据挖掘实战标准及流程企业标准流程完成项目实战,保障所学即为所用
教学模式
课堂教学
项目实战
课后指导
掌握评测
专项练习
教学服务
CDA俱乐部-打造你的职业生态圈老学员毕业后可加入CDA俱乐部,持续帮助学员终身成长,一次学习,永久服务
  • CDAS 数据分析行业峰会
    行业峰会

    万人报名
    千人参加
    行业大咖
    尽情交流

  • 数据私享会
    数据私享会

    专属实名制社群
    线上线下不定期分享
    分享适合你的
    数据分析报告

  • 高端人脉
    高端人脉

    领域研习交流
    行业大牛讲座
    技术大牛分享
    紧跟科技前沿

  • 职场资源
    职场资源

    上百家企业
    猎头对接
    助力职场晋升
    突破职业瓶颈

请输入您的姓名

OK