CDA Level Ⅱ:建模分析师。两年以上数据分析岗位工作经验,或通过CDA Level Ⅰ认证半年以上。在政府、金融、电信、零售、互联网、电商、医学等行业专门从事数据分析与数据挖掘的人员。在Level Ⅰ的基础之上深入掌握高级多元统计方法,并且拓展时间序列分析和主要数据挖掘的理论知识与业界运用;能够熟练使用SAS、R、Matlab和SPSS中至少一个专业统计软件实现相关算法;熟悉使用SQL访问企业级数据库;具有按照数据挖掘标准流程进行项目需求分析、数据验证、建模与模型评估的能力。
CDA Level Ⅱ培训课程安排
背景介绍
CDA Level Ⅰ为基础薄弱的学员提供了入行的机会,能够结合业务完成基本的数据分析并作出数据报告。但企业想要在竞争激烈的市场中胜出,决策的速度和反应的效率尤为重要。根据调查显示,75%的企业在面临拟定策略时,常常无法获得实时且有根据的决策信息。什么样的数据、要通过什么样的方法,才能快速便捷的提供对决策有价值的信息,是现代企业所面临最迫切性的问题。因此,在CDA Level Ⅰ的基础上,CDA Level Ⅱ(建模分析师)即为企业决策提供及时有效、易实现、可信赖的数据支持。
在建模分析师中,数据挖掘(Data Mining)技术无疑是他们最强有力的核心竞争力。数据挖掘强调与现有信息系统的整合,以提供决策者做决策时所需的情报,或转化成经营智慧,以作为调整营运策略方针的辅助工具。以顾客关系管理(CRM)为例,数据挖掘是整个顾客关系管理的核心。其不但可以准确的定位目标市场,进行精准营销,还可以帮助业务人员了解客户深层需求,针对大量客户进行客制化,也就是所谓的一对一营销。本课程的目的就是要针对数据挖掘整套流程,根据CDA Level Ⅱ大纲标准,以金融、电信、电商和零售业为案例背景,结合SAS Enterprise Miner和SPSS Moderler深入讲授数据挖掘的主要算法。并将SAS语言和SQL进行有效的结合,讲授如何在实际工作中搭建数据挖掘环境,制定分类数据挖掘的标准流程,让学员胜任全方位的数据挖掘运用场景。
CDA LEVEL Ⅱ课程安排
项目名称 |
CDA Level Ⅱ建模分析师系统培训 |
时间 |
北京:2015年10月15-11月1日 八天 上海:2015年11月19-12月6日 八天
|
地点 |
面授班:北京,人大经济论坛教室 面授班:上海,人民广场教室 远程班:在线同步直播 |
价格 |
面授:7400元
远程:5500元
|
优惠 |
1. 全日制学生及CDA LEVEL Ⅰ老学员8折优惠(学生证证明文件) 2. 同一单位三人及以上报名9折优惠,五人及以上8折优惠 3. CDA LEVEL Ⅰ等级资格证书持有者立省1000元 4. 同时报名参加LEVELⅠ和LEVEL Ⅱ享受8折优惠。 点击查看LEVEL Ⅰ课程详情 以上优惠不可叠加! |
证书认证 |
1. 可申请报考《CDA LEVEL Ⅱ等级认证证书》(荐:含金量高)
2. 可申请工信部《数据分析师证书》,申请费用400元(培训后即可得到) 以上双证皆自愿申请 |
现场班福利 |
全套视频资料,终身学习,在线答疑
咖啡茶歇,论坛币(1000个) |
学员对象:
1)各行业数据分析、数据挖掘从业者
2)金融、电信、零售、医学等各行业业务数据分析人员
3)政府事业单位大数据及数据挖掘项目人员
4)数据挖掘岗位就业、提拔涨薪、技能优化等从业人员
5)对数据挖掘感兴趣的各界人员
学员基础要求:
1)掌握CDA LEVEL Ⅰ大纲要求,CDA LEVEL Ⅰ详情:http://bbs.pinggu.org/thread-3419416-1-1.html
2)报名赠送《SAS初级视频》+《R语言及数据挖掘视频》,提前观看视频做好预习工作。自行安装好SAS软件(带有EM模块),SPSS Modeler,MySQL及R软件。R软件的下载网址为"http://www.r-project.org/";MySQL的下载网址为"http://www.mysql.com/。
课程收益
(1)了解什么是顾客关系管理;(2)了解顾客关系管理系统的架构及其组成元素;(3)了解如何利用顾客关系管理系统来进行营销活动;(4)了解什么是数据挖掘(Data Mining);(5)掌握数据挖掘技术的功能分类;(6)掌握数据挖掘技术的绩效增益;(7)了解数据挖掘技术的产业标准;(8)掌握如何利用数据挖掘技术来筛选关键变量(Key Attribute);(9)掌握如何利用数据挖掘技术来进行交叉销售(Cross-Selling);(10)掌握如何利用数据挖掘技术来评估客户的信用风险(Credit Risk); (11)了解如何利用数据挖掘技术来分析顾客行为、产生商业智慧并发展营销策略。(12)掌握如何使用数据挖掘工具SAS EM/SPSS Modeler来完成上述的各项工作。(13)掌握MySQL等主流数据库的使用。(14) 构建易实施的MySQL数据挖掘环境。(15)掌握构建信用打分卡的流程。
CDA Level Ⅱ培训课程大纲
详细大纲
时 程 |
大纲内容 |
第1天 |
主题:顾客关系管理及基础数据挖掘技术 |
企业使用之范围: 说明企业如何利用顾客关系管理来进行营销活动 |
|
理论介绍: 顾客关系管理系统的架构及其组成元素 企业如何利用顾客关系管理系统来进行营销活动 数据挖掘技术的功能分类 数据挖掘技术的绩效增益 数据挖掘技术的产业标准 数据挖掘基本观念与实际应用解说 |
|
SAS EM & SPSS Modeler实务案例操作: Introduction to SAS Enterprise Miner(SAS EM) & IBM SPSS Modeler Getting Started with SAS EM 12.1 & IBM SPSS Modeler 16 Creating a EM Project, Library and Diagram Creating a SPSS Modeler Project |
|
第1天 第2天 |
主题:基础数据挖掘技术 |
企业使用之范围: |
|
理论介绍: 数据挖掘技术的流程-SEMMA vs. CRISP DM 数据前处理(Data Preprocessing)技术 Attribute Selection(字段选择) *Data Integration(数据整合) Data Cleansing(数据清洗): *Wrong Value(错误值), *Outlier(离群值), *Missing Value(遗失值) Attribute Enrichment(字段扩充): *内/外部数据的扩充方法 Data Coding(数据编码): *Data Transformation(数据转换), *Data Reduction(数据精简), *Record Reduction(记录精简), *Attribute Value Reduction(域值精简), *Attribute Reduction(字段精简) |
|
SAS EM & SPSS Modeler实务案例操作: Defining a Data Source Exploring a Data Source * Exploring Source Data * Changing the Explore Window Sampling Defaults * Modifying and Correcting Source Data Managing Wrong Values/Outliers/Missing Values Transforming Inputs Recording Categorical Inputs |
|
第2天 第3天 |
主题:进阶数据挖掘技术 |
企业使用之范围: 说明企业如何利用关键变量发掘技术来发掘对项目目标有效之关键变量,以做为数据挖掘之输入变量 |
|
理论介绍: 训练数据与测试数据的产生方法 关键变量(Key Attributes)发掘技术 *卡方检定(Chi-square Test) *t检定及ANOVA检定(t Test & ANOVA Test) *利用决策树(Decision Tree)选择关键变量 |
|
SAS EM & SPSS Modeler实务案例操作: Creating Training & Validation Dataset Variable Selection Using Partial Least Squares for Input Selection Using the Decision Tree for Input Selection |
|
第3天 |
主题:进阶数据挖掘技术2 |
企业使用之范围: 说明如何利用分类技术之决策树来建立交叉销售(Cross-Selling)模型,以提升公司获利 |
|
理论介绍: 分类之决策树(Decision Tree) |
|
SAS EM & SPSS Modeler实务案例操作: Constructing a Decision Tree Model Optimizing the Complexity of Decision Trees Assessing a Decision Tree Understanding Additional Plots & Tables Automatic Tree Growth |
|
第3天 |
主题:进阶数据挖掘技术3 |
企业使用之范围: 说明企业如何利用分类技术之神经网络、支持向量机及分类多模型整合来建立信用评分(Credit Scoring)模型,以降低公司损失 |
|
理论介绍: 分类之神经网络(Neural Network) 分类之支持向量机(Support Vector Machine) 分类多模型整合(Ensemble)之装袋(Bagging)、增强(Boosting)学习 |
|
SAS EM &SPSS Modeler实务案例操作: Training a Neural Network Selecting Neural Network Inputs Increasing Network Flexibility Using the AutoNeural Tool Constructing a Support Vector Machine Constructing Ensemble Models by Using Bagging and Boosting Techniques Model Comparisons |
|
第4天 |
主题:进阶数据挖掘技术4 |
企业使用之范围: 说明企业如何利用模型评估技术来评估模型的优劣,以作为采用适当模型的准则 |
|
理论介绍: 模型评估(Model Assessment)技术 |
|
SAS EM & SPSS Modeler实务案例操作: Model Fit Statistics: * Comparing Models with Summary Statistics Statistical Graph: * Comparing Models with ROC Charts * Comparing Models with Score Rankings Plots * Adjusting for Separate Sampling Profit Matrix: * Evaluating Model Profit * Viewing Additional Assessments * Optimizing with Profit Internally Scored Data Sets: * Creating a Score Data Source * Scoring with the Score Tool * Exporting a Scored Table Score Code Modules: * Creating a SAS Score Code Module * Creating Other Score Code Modules |
|
第4天 |
主题:进阶数据挖掘技术5 |
企业使用之范围: 说明企业如何利用预测(Prediction)技术之回归树及类神经网络来建立数值预测模型-如预测客户之年收入,以利公司设计营销活动 |
|
理论介绍: 回归树(Regression Tree) |
|
SAS EM & SPSS Modeler实务案例操作: Review and Set the Decision Tree Node Review and Set the Neural Network Node |
|
第4天 |
主题:进阶数据挖掘技术6 |
企业使用之范围: 说明企业如何利用关联及序列分析技术来建立交叉销售(Cross-Selling)及提升销售(Up-Selling)模型,以提升公司获利 |
|
理论介绍: 关联分析(Association Analysis) 序列分析(Sequence Analysis) |
|
SAS EM & SPSS Modeler案例案例操作: Consolidating Categorical Inputs Market Basket Analysis Sequence Analysis |
|
第5天
第6天 |
主题:SAS数据整理(涵盖SAS初级程序员知识) |
上午:
2 、访问数据
|
|
下午:
|
|
主题:SAS编程进阶(涵盖SAS高级程序员知识) |
|
上午:
|
|
第7天 |
上午: |
第8天 |
主题:SAS数据挖掘建模(涵盖SAS商业数据分析师知识)
上午:
|
下午: |
主要操作案例:
1. 营销客户分群:ABC银行的营销部门想要针对该银行客户的使用行为,进行分群分析,以了解现行客户对本行的往来方式,并进一步提供适宜的营销接触模式。该银行从有效户(近三个月有交易者),取出10万笔样本数据。依下列四种交易管道进行客户分群分析:传统临柜交易(TBM)、自动柜员机交易(ATM)、银行专员服务(POS)、电话客服(CSC)。演练重点为极端值数据处理、分群变量选择、衍生变量产出、分群参数调整与分群结果解释。
2. 网站使用行为关联分析:ABC音乐广播电台为了服务更多听众,设置了电台网站,让更多的在线听众也可以透过网站服务以随时掌握电台的各个节目信息,网站提供了流行音乐趋势(music streams)、音乐下载(podcasts)、新闻讯息(news streams)、在线收听(live Web )以及历史节目收听(archives)等服务功能页面。分析人员想要藉由关联分析以进一步了解在线听众的使用行为,做为网站服务功能更新的依据。分析样本为捞取近两个月约150万笔的客户事务数据。分析目的为依据使用者网站事务数据,利用关联分析演算方法产生网站使用行为关联规则。演练重点为产生关联分析数据集、进行关联分析、关联分析结果解释。
3. XYZ银行的消费金融部门想了解既有的小额信贷客户的信用行为状况,建立一风险预测模型,藉以调整最适的授信政策、客户的信贷利率与信用额度,一达到风险管控,另一部分透过产品调整达到客户维护,与刺激信用额度动用。分析样本数据3000笔,坏客户比例16%。分析目的为依据可能影响违约之风险因子,利用判定树等分类演算方法建立信贷客户之风险预测模型。演练重点为数据浏览、遗失值处理、衍生变量产出、数据集分割(训练、验证、测试数据集)、预测模型变量筛选、判定树预测模型建置、判定树模型参数设定与模型解读、跨模型评估方法。
4. 捐款流失预测:某退除役军人协会过去内部的运作经费部份来自一般民众的捐款。协会多透过寄发会刊等出版品给一般民众,以获得民众对协会更多的了解与捐款。这次协会想要从过去对曾捐款的流失会员所做的活动响应纪录,来建立一个预测模型,并应用在未来对于捐款流失的会员中找到潜在仍会捐赠的名单,定期再提供给他们协会讯息或纪念小卡等。该协会目前约有350万名的捐款会员。针对流失会员的定义为近一到两年已无捐款者。本次的接触活动会针对预测分析所找出的名单,寄发贺卡。所取的样本数据为有响应与无响应者为1:1的过度抽样。真实母体数据的响应率为5%。
5. 信用风险模型。
次要操作案例:
1. 有机食品(Organic Product)营销案例
2. 人口普查数据集(Census Dataset)聚类案例
3. 牛仔裤商店(Jean Store)聚类分析案例
4. 银行客户购买金融商品(Financial Product)之关联分析(Association Analysis)案例
5. 文具(Stationery)及健康美容(Health & Beauty)用品之关联分析(Association Analysis)案例
6. 银行客户购买金融商品(Financial Product)之序列分析(Sequential Analysis)案例
李御玺,教授,国立台湾大学资讯工程博士,铭传大学资讯工程学系教授,铭传大学大数据研究中心主任,中华数据挖掘协会理事,云南财经大学信息学院客座教授,浙江大学城市学院客座教授,厦门大学数据挖掘中心顾问,中国人民大学数据挖掘中心顾问,IBM SPSS-China顾问,SAS-Taiwan顾问。在其相关研究领域已发表超过260篇以上的研究论文,同时也是国科会与教育部多个相关研究计划的主持人。
服务过的客户包括:中国工商局、中信银行、台新银行、联邦银行、新光银行、 新竹国际商业银行(现已并入渣打银行)、第一银行、永丰银行、远东银行、美商大都会人寿、嘉义基督教医院、台湾微软、零售业如赫莲娜(Helena Rubinstein)化妆品公司、特立和乐(HOLA)公司、航空公司如东方航空公司、中华航空公司、汽车行业如福特(Ford)汽车公司;政府行业如国税局等。
徐筱刚,男,高级数据分析师,具有深厚的数理统计与应用数据分析专业背景,上海某金融机构数据分析部门高级DA,具有八年数据分析、数据挖掘的从业经验,曾就职零售企业、咨询公司等,独立或带团队完成零售、电信、金融等多个大型数据挖掘项目。
常国珍,曾为德勤管理咨询高级数据挖掘咨询顾问,SAS官方培训资深讲师,2014年SAS软件大赛判卷人,曾以数据挖掘工程师身份就职于亚信科技(中国)有限公司市场部。具有八年的数据挖掘实战经验,主攻分类模型,涉及客户精准营销、信用评估、价值提升、欺诈侦测和流失预警等数据挖掘主题,尤其熟悉银行个人客户精准营销的建模工作。
资格认证:SAS全球认证“Certified Statistical Business Analyst Using SAS 9 Regression and Modeling”、“Certified Advanced Programmer for SAS 9”。
报名咨询
电话:010-68454276
手机:
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
最近我发现一个绝招,用DeepSeek AI处理Excel数据简直太爽了!处理速度嘎嘎快! 平常一整天的表格处理工作,现在只要三步就能搞 ...
2025-04-01你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/go ...
2025-03-12以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-11