CDA Level Ⅱ:建模分析师。两年以上数据分析岗位工作经验,或通过CDA Level Ⅰ认证半年以上。在政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与数据挖掘的人员。在Level Ⅰ的基础之上深入掌握高级多元统计方法,并且拓展时间序列分析和主要数据挖掘的理论知识与业界运用;能够熟练使用SAS、R、Matlab和SPSS中至少一个专业统计软件实现相关算法;熟悉使用SQL访问企业级数据库;具有按照数据挖掘标准流程进行项目需求分析、数据验证、建模与模型评估的能力。
级别 |
Level II |
理论 |
统计学、概率论和数理统计、多元统计分析、时间序列、数据挖掘(DM) |
软件 |
必要:EXCEL、SQL、SAS/SPSS 可选:Python、R、MATLAB;SQL等(/表示“或”) |
分析方法要求 |
除掌握基本数据处理及分析方法以外,还应掌握高级数据分析及数据挖掘方法(多元线性回归法,生存分析法,神经网络,决策树,判别分析法,主成分分析法,因子分析法,典型相关分析,聚类分析法,关联规则,支持向量机,bagging,boosting等)和可视化技术。 |
业务分析能力 |
至少在客户关系管理、管理会计、信用风险管理、人力资源管理等其中一个数据分析的常用领域内具有深入的业务经验,可以将业务目标转化为数据分析目标;熟悉企业内数据的生成过程,可以熟练的访问常见数据库;根据项目需求,以最快捷的方式获取业界最新案例和学界最新研究成果,并且转化为行动方针;可以熟练的提取所需信息,能够从海量数据中搜集并提取信息;根据项目目的,结合业务经验选取最优建模方法。 |
结果展现能力 |
报告体现数据挖掘的整体流程,层层阐述信息的收集、模型的构建、结果的验证和解读,对行业进行评估,优化和决策。 |
CDA Level Ⅱ培训课程大纲
详细大纲
时 程 |
大纲内容 |
第1天 |
主题:顾客关系管理及基础数据挖掘技术 |
企业使用之范围: 说明企业如何利用顾客关系管理来进行营销活动 |
|
理论介绍: 顾客关系管理系统的架构及其组成元素 企业如何利用顾客关系管理系统来进行营销活动 数据挖掘技术的功能分类 数据挖掘技术的绩效增益 数据挖掘技术的产业标准 数据挖掘基本观念与实际应用解说 |
|
SAS EM & SPSS Modeler实务案例操作: Introduction to SAS Enterprise Miner(SAS EM) & IBM SPSS Modeler Getting Started with SAS EM 12.1 & IBM SPSS Modeler 16 Creating a EM Project, Library and Diagram Creating a SPSS Modeler Project |
|
第1天 第2天 |
主题:基础数据挖掘技术 |
企业使用之范围: |
|
理论介绍: 数据挖掘技术的流程-SEMMA vs. CRISP DM 数据前处理(Data Preprocessing)技术 Attribute Selection(字段选择) *Data Integration(数据整合) Data Cleansing(数据清洗): *Wrong Value(错误值), *Outlier(离群值), *Missing Value(遗失值) Attribute Enrichment(字段扩充): *内/外部数据的扩充方法 Data Coding(数据编码): *Data Transformation(数据转换), *Data Reduction(数据精简), *Record Reduction(记录精简), *Attribute Value Reduction(域值精简), *Attribute Reduction(字段精简) |
|
SAS EM & SPSS Modeler实务案例操作: Defining a Data Source Exploring a Data Source * Exploring Source Data * Changing the Explore Window Sampling Defaults * Modifying and Correcting Source Data Managing Wrong Values/Outliers/Missing Values Transforming Inputs Recording Categorical Inputs |
|
第2天 第3天 |
主题:进阶数据挖掘技术 |
企业使用之范围: 说明企业如何利用关键变量发掘技术来发掘对项目目标有效之关键变量,以做为数据挖掘之输入变量 |
|
理论介绍: 训练数据与测试数据的产生方法 关键变量(Key Attributes)发掘技术 *卡方检定(Chi-square Test) *t检定及ANOVA检定(t Test & ANOVA Test) *利用决策树(Decision Tree)选择关键变量 |
|
SAS EM & SPSS Modeler实务案例操作: Creating Training & Validation Dataset Variable Selection Using Partial Least Squares for Input Selection Using the Decision Tree for Input Selection |
|
第3天 |
主题:进阶数据挖掘技术2 |
企业使用之范围: 说明如何利用分类技术之决策树来建立交叉销售(Cross-Selling)模型,以提升公司获利 |
|
理论介绍: 分类之决策树(Decision Tree) |
|
SAS EM & SPSS Modeler实务案例操作: Constructing a Decision Tree Model Optimizing the Complexity of Decision Trees Assessing a Decision Tree Understanding Additional Plots & Tables Automatic Tree Growth |
|
第3天 |
主题:进阶数据挖掘技术3 |
企业使用之范围: 说明企业如何利用分类技术之神经网络、支持向量机及分类多模型整合来建立信用评分(Credit Scoring)模型,以降低公司损失 |
|
理论介绍: 分类之神经网络(Neural Network) 分类之支持向量机(Support Vector Machine) 分类多模型整合(Ensemble)之装袋(Bagging)、增强(Boosting)学习 |
|
SAS EM &SPSS Modeler实务案例操作: Training a Neural Network Selecting Neural Network Inputs Increasing Network Flexibility Using the AutoNeural Tool Constructing a Support Vector Machine Constructing Ensemble Models by Using Bagging and Boosting Techniques Model Comparisons |
|
第4天 |
主题:进阶数据挖掘技术4 |
企业使用之范围: 说明企业如何利用模型评估技术来评估模型的优劣,以作为采用适当模型的准则 |
|
理论介绍: 模型评估(Model Assessment)技术 |
|
SAS EM & SPSS Modeler实务案例操作: Model Fit Statistics: * Comparing Models with Summary Statistics Statistical Graph: * Comparing Models with ROC Charts * Comparing Models with Score Rankings Plots * Adjusting for Separate Sampling Profit Matrix: * Evaluating Model Profit * Viewing Additional Assessments * Optimizing with Profit Internally Scored Data Sets: * Creating a Score Data Source * Scoring with the Score Tool * Exporting a Scored Table Score Code Modules: * Creating a SAS Score Code Module * Creating Other Score Code Modules |
|
第4天 |
主题:进阶数据挖掘技术5 |
企业使用之范围: 说明企业如何利用预测(Prediction)技术之回归树及类神经网络来建立数值预测模型-如预测客户之年收入,以利公司设计营销活动 |
|
理论介绍: 回归树(Regression Tree) |
|
SAS EM & SPSS Modeler实务案例操作: Review and Set the Decision Tree Node Review and Set the Neural Network Node |
|
第4天 |
主题:进阶数据挖掘技术6 |
企业使用之范围: 说明企业如何利用关联及序列分析技术来建立交叉销售(Cross-Selling)及提升销售(Up-Selling)模型,以提升公司获利 |
|
理论介绍: 关联分析(Association Analysis) 序列分析(Sequence Analysis) |
|
SAS EM & SPSS Modeler案例案例操作: Consolidating Categorical Inputs Market Basket Analysis Sequence Analysis |
|
第5天 |
环境搭建与数据转换
|
主体:数据分析环境搭建 1、Python程序安装 2、MySQL数据库安装、配置、建库;
|
|
主题:Python与其它软件之间数据转换 1、Python内部的数据存储类型 2、Python与CSV格式文件; 3、Python与EXCEL格式文件; 4、Python与MySQL; 5、Python与ODBC;
|
|
主题:用R作统计 两变量相关检验(两样本T检验、方差分析、卡方检验、相关检验); 主成分与因子分析; |
|
|
数据挖据完整流程案例 ——Python编程构造银行信用风险模型 |
第6天 |
主题:信用风险建模简介 银行信用风险监管体系与信用风险内部模型 主题:单变量检验与数据清洗 缺失值检验与处理方法 异常值检验与处理方法 解释变量粗筛 双变量关系检验法 数据分箱 |
主题:连续变量压缩技术 变量聚类 分类变量压缩技术 似完整分类数据问题 WOE方法 主题:逻辑回归建模技术 模型选择:逐步法、全子集法 根据经验Logit曲线进行连续变量转换 主题:编程模型评估技术 ROC曲线 K-S曲线 |
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/go ...
2025-03-12以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-11随着数字化转型的加速,企业积累了海量数据,如何从这些数据中挖掘有价值的信息,成为企业提升竞争力的关键。CDA认证考试体系应 ...
2025-03-10推荐学习书籍 《CDA一级教材》在线电子版正式上线CDA网校,为你提供系统、实用、前沿的学习资源,助你轻松迈入数据分析的大门! ...
2025-03-07在数据驱动决策的时代,掌握多样的数据分析方法,就如同拥有了开启宝藏的多把钥匙,能帮助我们从海量数据中挖掘出关键信息,本 ...
2025-03-06