热线电话:13121318867

登录
首页精彩阅读CDA数据分析师LEVEL 2系统培训课程
CDA数据分析师LEVEL 2系统培训课程
2015-05-13
收藏

CDA Level Ⅱ:建模分析师。两年以上数据分析岗位工作经验,或通过CDA Level Ⅰ认证半年以上。在政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与数据挖掘的人员。在Level Ⅰ的基础之上深入掌握高级多元统计方法,并且拓展时间序列分析和主要数据挖掘的理论知识与业界运用;能够熟练使用SAS、R、Matlab和SPSS中至少一个专业统计软件实现相关算法;熟悉使用SQL访问企业级数据库;具有按照数据挖掘标准流程进行项目需求分析、数据验证、建模与模型评估的能力。

CDA Level Ⅱ培训课程安排

背景介绍

CDA Level Ⅰ为基础薄弱的学员提供了入行的机会,能够结合业务完成基本的数据分析并作出数据报告。但企业想要在竞争激烈的市场中胜出,决策的速度和反应的效率尤为重要。根据调查显示,75%的企业在面临拟定策略时,常常无法获得实时且有根据的决策信息。什么样的数据、要通过什么样的方法,才能快速便捷的提供对决策有价值的信息,是现代企业所面临最迫切性的问题。因此,在CDA Level Ⅰ的基础上,CDA Level Ⅱ(建模分析师)即为企业决策提供及时有效、易实现、可信赖的数据支持。

在建模分析师中,数据挖掘(Data Mining)技术无疑是他们最强有力的核心竞争力。数据挖掘强调与现有信息系统的整合,以提供决策者做决策时所需的情报,或转化成经营智慧,以作为调整营运策略方针的辅助工具。以顾客关系管理(CRM)为例,数据挖掘是整个顾客关系管理的核心。其不但可以准确的定位目标市场,进行精准营销,还可以帮助业务人员了解客户深层需求,针对大量客户进行客制化,也就是所谓的一对一营销。本课程的目的就是要针对数据挖掘整套流程,根据CDA Level Ⅱ大纲标准,以金融、电信、电商和零售业为案例背景,结合SAS Enterprise Miner和SPSS Moderler深入讲授数据挖掘的主要算法。并将SAS/PYTHON语言和SQL进行有效的结合,讲授如何在实际工作中搭建数据挖掘环境,制定分类数据挖掘的标准流程,让学员胜任全方位的数据挖掘运用场景。

CDA LEVEL Ⅱ课程安排

项目名称
CDA Level Ⅱ建模分析师系统培训
时间

上海:2015年6月11-14日,20-21日  六天

北京:2015年7月9-12日,18-19日 六天

深圳:2015年8月13-16日,22-23日 六天

地点

面授班:北京,人大经济论坛教室

面授班:上海,人民广场教室

远程班:在线同步直播
价格
面授:5900元
远程:4400元
优惠

1.     全日制学生及CDA LEVEL 老学员8折优惠(学生证证明文件)

2.     同一单位三人及以上报名9折优惠,五人及以上8折优惠

3.     CDA LEVEL 等级资格证书持有者立省1000元

4.     同时报名参加LEVEL和LEVEL Ⅱ享受8优惠。

点击查看LEVEL Ⅰ课程详情          以上优惠不可叠加!

证书认证
1.     可申请报考《CDA LEVEL 等级认证证书》(荐:含金量高)

2.     可申请工信部NTC《数据分析师证书》,申请费用400元(培训后即可得到)

以上双证皆自愿申请

现场班福利
全套视频资料,终身学习,在线答疑

午餐,咖啡茶歇,论坛币(1000个)

学员对象:

1)各行业数据分析、数据挖掘从业者

2)金融、电信、零售、医学等各行业业务数据分析人员

3)政府事业单位大数据及数据挖掘项目人员

4)数据挖掘岗位就业、提拔涨薪、技能优化等从业人员

5)对数据挖掘感兴趣的各界人员


学员基础要求:

1)掌握CDA LEVEL Ⅰ大纲要求,CDA LEVEL Ⅰ详情:http://bbs.pinggu.org/thread-3419416-1-1.html

2)报名赠送《SAS初级视频》+《R语言数据挖掘视频》,提前观看视频做好预习工作。自行安装好SAS软件(带有EM模块),SPSS Modeler,MySQL及R软件。R软件的下载网址为"http://www.r-project.org/";MySQL的下载网址为"http://www.mysql.com/



课程收益

(1)了解什么是顾客关系管理;(2)了解顾客关系管理系统的架构及其组成元素;(3)了解如何利用顾客关系管理系统来进行营销活动;(4)了解什么是数据挖掘(Data Mining);(5)掌握数据挖掘技术的功能分类;(6)掌握数据挖掘技术的绩效增益;(7)了解数据挖掘技术的产业标准;(8)掌握如何利用数据挖掘技术来筛选关键变量(Key Attribute);(9)掌握如何利用数据挖掘技术来进行交叉销售(Cross-Selling);(10)掌握如何利用数据挖掘技术来评估客户的信用风险(Credit Risk); (11)了解如何利用数据挖掘技术来分析顾客行为、产生商业智慧并发展营销策略。(12)掌握如何使用数据挖掘工具SAS EM/SPSS Modeler/Python来完成上述的各项工作。(13)掌握MySQL等主流数据库的使用。(14) 构建易实施的MySQL和Python数据挖掘环境。(15)掌握构建信用打分卡的流程和Python语言脚本。


CDA Level Ⅱ培训课程大纲

详细大纲

时 程

大纲内容


第1天


主题:顾客关系管理及基础数据挖掘技术

企业使用之范围:

说明企业如何利用顾客关系管理来进行营销活动

理论介绍:

顾客关系管理系统的架构及其组成元素

企业如何利用顾客关系管理系统来进行营销活动

数据挖掘技术的功能分类

数据挖掘技术的绩效增益

数据挖掘技术的产业标准

数据挖掘基本观念与实际应用解说

SAS EM & SPSS Modeler实务案例操作:

Introduction to SAS Enterprise Miner(SAS EM) & IBM SPSS Modeler

Getting Started with SAS EM 12.1 & IBM SPSS Modeler 16

Creating a EM Project, Library and Diagram

Creating a SPSS Modeler Project


第1天

第2天


主题:基础数据挖掘技术

企业使用之范围:

说明企业如何利用数据前处理技术来进行数据的重整,建置数据仓库,以做为数据挖掘之输入

理论介绍:

数据挖掘技术的流程-SEMMA vs. CRISP DM

数据前处理(Data Preprocessing)技术

Attribute Selection(字段选择)

*Data Integration(数据整合)

Data Cleansing(数据清洗):

*Wrong Value(错误值),

*Outlier(离群值),

*Missing Value(遗失值)

Attribute Enrichment(字段扩充):

*内/外部数据的扩充方法

Data Coding(数据编码):

*Data Transformation(数据转换),

*Data Reduction(数据精简),

*Record Reduction(记录精简),

*Attribute Value Reduction(域值精简),

*Attribute Reduction(字段精简)

SAS EM & SPSS Modeler实务案例操作:

Defining a Data Source

Exploring a Data Source

  * Exploring Source Data

  * Changing the Explore Window Sampling Defaults

  * Modifying and Correcting Source Data

Managing Wrong Values/Outliers/Missing Values

Transforming Inputs

Recording Categorical Inputs


第2天

第3天


主题:进阶数据挖掘技术

企业使用之范围:

说明企业如何利用关键变量发掘技术来发掘对项目目标有效之关键变量,以做为数据挖掘之输入变量

理论介绍:

训练数据与测试数据的产生方法

关键变量(Key Attributes)发掘技术

*卡方检定(Chi-square Test)

*t检定及ANOVA检定(t Test & ANOVA Test)

*利用决策树(Decision Tree)选择关键变量

SAS EM & SPSS Modeler实务案例操作:

Creating Training & Validation Dataset

Variable Selection

Using Partial Least Squares for Input Selection

Using the Decision Tree for Input Selection


第3天


主题:进阶数据挖掘技术2

企业使用之范围:

说明如何利用分类技术之决策树来建立交叉销售(Cross-Selling)模型,以提升公司获利

理论介绍:

分类之决策树(Decision Tree)

SAS EM & SPSS Modeler实务案例操作:

Constructing a Decision Tree Model

Optimizing the Complexity of Decision Trees

Assessing a Decision Tree

Understanding Additional Plots & Tables

Automatic Tree Growth


第3天


主题:进阶数据挖掘技术3

企业使用之范围:

说明企业如何利用分类技术之神经网络支持向量机及分类多模型整合来建立信用评分(Credit Scoring)模型,以降低公司损失

理论介绍:

分类之神经网络(Neural Network)

分类之支持向量机(Support Vector Machine)

分类多模型整合(Ensemble)之装袋(Bagging)、增强(Boosting)学习

SAS EM &SPSS Modeler实务案例操作:

Training a Neural Network

Selecting Neural Network Inputs

Increasing Network Flexibility

Using the AutoNeural Tool

Constructing a Support Vector Machine

Constructing Ensemble Models by Using Bagging and Boosting Techniques

Model Comparisons


第4天


主题:进阶数据挖掘技术4

企业使用之范围:

说明企业如何利用模型评估技术来评估模型的优劣,以作为采用适当模型的准则

理论介绍:

模型评估(Model Assessment)技术

SAS EM & SPSS Modeler实务案例操作:

Model Fit Statistics:

* Comparing Models with Summary Statistics

Statistical Graph:

* Comparing Models with ROC Charts

* Comparing Models with Score Rankings Plots

* Adjusting for Separate Sampling

Profit Matrix:

* Evaluating Model Profit

* Viewing Additional Assessments

* Optimizing with Profit

Internally Scored Data Sets:

  * Creating a Score Data Source

  * Scoring with the Score Tool

  * Exporting a Scored Table

Score Code Modules:

  * Creating a SAS Score Code Module

  * Creating Other Score Code Modules


第4天


主题:进阶数据挖掘技术5

企业使用之范围:

说明企业如何利用预测(Prediction)技术之回归树及类神经网络来建立数值预测模型-如预测客户之年收入,以利公司设计营销活动

理论介绍:

回归树(Regression Tree)

神经网络(Neural Network)-非线性回归

SAS EM & SPSS Modeler实务案例操作:

Review and Set the Decision Tree Node

Review and Set the Neural Network Node


第4天


主题:进阶数据挖掘技术6

企业使用之范围:

说明企业如何利用关联及序列分析技术来建立交叉销售(Cross-Selling)及提升销售(Up-Selling)模型,以提升公司获利

理论介绍:

关联分析(Association Analysis)

序列分析(Sequence Analysis)

SAS EM & SPSS Modeler案例案例操作:

Consolidating Categorical Inputs

Market Basket Analysis

Sequence Analysis

第5天

环境搭建与数据转换


主体:数据分析环境搭建

1、Python程序安装

2、MySQL数据库安装、配置、建库;


主题:Python与其它软件之间数据转换

1、Python内部的数据存储类型

2、Python与CSV格式文件;

3、Python与EXCEL格式文件;

4、Python与MySQL

5、Python与ODBC;


主题:SQL编程与MySQL数据库使用

Mysql SQL编程与Python SQL编程

主题:用R作统计

两变量相关检验(两样本T检验、方差分析、卡方检验、相关检验);

主成分与因子分析;

决策树


数据挖据完整流程案例

——Python编程构造银行信用风险模型


第6天


主题:信用风险建模简介

银行信用风险监管体系与信用风险内部模型

主题:单变量检验与数据清洗

缺失值检验与处理方法

异常值检验与处理方法

解释变量粗筛

双变量关系检验法

数据分箱

主题:连续变量压缩技术

变量聚类

分类变量压缩技术

似完整分类数据问题

WOE方法

主题:逻辑回归建模技术

模型选择:逐步法、全子集法

根据经验Logit曲线进行连续变量转换

主题:编程模型评估技术

ROC曲线

K-S曲线



讲师简介

李御玺,教授,国立台湾大学资讯工程博士,铭传大学资讯工程学系教授,铭传大学大数据研究中心主任,中华数据挖掘协会理事,云南财经大学信息学院客座教授,浙江大学城市学院客座教授,厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问,IBM SPSS-China顾问,SAS-Taiwan顾问。在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。

服务过的客户包括:中国工商局、中信银行、台新银行、联邦银行、新光银行、 新竹国际商业银行(现已并入渣打银行)、第一银行、永丰银行、远东银行、美商大都会人寿、嘉义基督教医院、台湾微软、零售业如赫莲娜(Helena Rubinstein)化妆品公司、特立和乐(HOLA)公司、航空公司如东方航空公司、中华航空公司、汽车行业如福特(Ford)汽车公司;政府行业如国税局等。


常国珍,曾为德勤管理咨询高级数据挖掘咨询顾问,SAS官方培训资深讲师,2014年SAS软件大赛判卷人,曾以数据挖掘工程师身份就职于亚信科技(中国)有限公司市场部。具有八年的数据挖掘实战经验,主攻分类模型,涉及客户精准营销、信用评估、价值提升、欺诈侦测和流失预警等数据挖掘主题,尤其熟悉银行个人客户精准营销的建模工作。

资格认证:SAS全球认证“Certified Statistical Business Analyst Using SAS 9 Regression and Modeling”、“Certified Advanced Programmer for SAS 9”。

参与项目:1、某国有大型银行企业级模型试验室建设; 2、某国有大型银行企业级欺诈系统建设;3、某股份制大型银行信用卡部产品精准营销建模和行为信用评级模型优化工作; 4、某股份制大型银行零售业务部客户忠诚度提升项目。


资格认证

CDA数据分析师LEVEL Ⅱ资格证书  

      

(此证书为CDA协会颁发,人大经济论坛国内主办,全国统考,一年两次,此证书为CDA数据分析师唯一认证证书,可以作为企业事业单位选拔和聘用专业人才的任职参考依据。


CDA考试安排:

1. 考试时间2015年6月28日

2. 考试内容:CDA LEVLE Ⅱ建模分析师大纲。

3. 报名费用:1500元/人。参加CDA系统培训学员费用为1000/人。

4. 其他:CDA考试一次不过可申请补考,补考费用为原价一半。证书3年审核一次。

5. 报考链接:http://cda.pinggu.org/cda_exam.html


国家工信部数据分析师证书


此证书参加CDA培训后随堂考试,通过即可获得,证书申请费用为400元。(可自愿申请)


报名流程

1.在线填写报名信息

2.给予反馈,确认报名信息

3.网上缴费

4.开课前一周发送电子版课件和教室路线图


(北京现场班)

(上海现场班

(远程直播班)


微博关注:@CDA数据分析师_人大经济论坛
QQ交流群:274123859
微信订阅:CDA数据分析师

数据分析咨询请扫描二维码

最新资讯
更多
客服在线
立即咨询