以 CDA 认证的 LEVEL II 和 LEVEL III 大纲为核心,目标培养同时具有策略优化和数据挖掘能力的全栈数据挖掘人才,而非只懂“调算法包,跑代码”的单一技能程序员。
课程内容兼顾培养每位学员的双向技能,既有解决数据挖掘流程问题的横向能力,又有解决数据挖掘算法问题的纵向能力。
数据挖掘流程问题的横向能力要求学备从数据治理根源出发的思维,通过数字化工作方法来探查业务问题,通过近因分析工具、宏观根因分析等手段,再选择业务流程优化工具还是算法工具,而非“遇到问题调算法包”。
数据挖掘算法纵向能力要求学生在使用算法解决微观根因分析、预测分析的问题上,根据业务场景来综合判断,洞察数据规律,使用正确的数据清洗与特征工程方法,综合使用统计分析方法、统计模型、运筹学、机器学习、深度学习、文本挖掘算法,而非单一的机器学习算法。
数据挖掘算法方向,是目前IT互联网行业热门的职业方向,国内数据挖掘人才的招聘市场,不管是现阶段还是未来的至少五年到十年内,都持续保持供不应求的状态。
数据挖掘工程师专注于用数据挖掘算法为企业挖掘数据中的金矿,为决策分析和预测分析提供强有力的支持,是提升企业核心竞争力的关键人才。
数据挖掘工程师遍布互联网、电商、搜索、社交等众多热门行业,未来的人工智能、自动驾驶领域也将是数据挖掘工程师的舞台,学会数据挖掘的你,也将是优秀企业最需要的数字化人才。
数据治理驱动因素、数据治理域、数据管理域、数据应用域、如何开展数据治理
解决企业数据治理问题,理清企业数据逻辑,提高企业数据质量与价值
领会数据分类中的主数据、交易数据和元数据概念;理解数据库建模中概念、逻辑、物理模型之间的关系;掌握数据治理方法与方向
EDIT数字化模型简介、业务探查(E)、问题诊断(D)、业务策略优化和指导(I)、算法工具介绍(T)
解决企业数据采集,数据模型构建,搭建数据之间的逻辑
领会数据分类中的主数据、交易数据和元数据概念;理解数据库建模中概念、逻辑、物理模型之间的关系;领会数据库范式的概念、数据仓库和数据集市、ETL过程;掌握关系模型与维度模型的使用场景
数据采集方法、数据模型管理
解决企业数据采集,数据模型构建,搭建数据之间的逻辑
领会数据分类中的主数据、交易数据和元数据概念;理解数据库建模中概念、逻辑、物理模型之间的关系;掌握关系模型与维度模型的使用场景
Python标准数据类型、控制流语句、自定义函数、异常和错误、类与面向对象编程、Python连接数据库操作、Python编程面试题集训
解决使用商业智能报表分析业务、监控业务的问题
具备Python代码编写阅读能力; 掌握基本的Python语法;熟悉面向对象的原理;掌握Python数据库编程;
Numpy数组基础操作、Pandas数据表的基本操作、Pandas数据探索、Pandas数据可视化、Python数据可视化包-Matplotlib介绍、Python数据可视化包-Seaborn介绍与图形绘制
完成企业实际工作中的数据清洗、转换等数据加工及可视化任务,为后续机器学习打下基础
掌握数据清洗的方法与技巧;掌握数据常用可视化的方法与技巧
实战案例:斯德哥尔摩气候可视化分析、餐饮订单数据清洗与分析、文本数据分析之QQ聊天记录可视化分析
实际项目检验学习成果,学以致用,更加贴近实战项目,达到学习价值
掌握Python综合使用技能,掌握numpy与pandas的用法
先导课:抽样方法、统计量及抽样分布、参数估计与假设检验、统计分析与Python实战、线性规划与二次优化; 实战案例:关于饮料消费的统计学分析、快递公司的路线策略优化
使用统计分析和运筹学的基础知识来解决与企业策略优化相关的问题,比如快递路线优化问题、商品价格定价策略问题等等。
熟悉常见统计分布的特点与应用;熟悉假设检验的基本概念与方法;掌握T检验、方差分析的方法步骤;掌握线性规划与二次优化
数据分析方法论介绍、方差分析、回归分析、分类数据分析、逻辑回归、数据降维、时间序列分析、实战案例:金融客户行为特征分解与营销策略优化、汽车行业销售预测与经营战略优化、基于广义线性模型的汽车保险分类定价策略的优化、收益率的系列预测、基于时间序列的机
可完成电商、金融、互联网等行业的用户行为分析与预测,商业策略分析等工作。
熟悉数据分析方法与步骤;掌握方差分析与应用,回归分析与应用,分类数据分析方法,时序数据的分析预测方法
用户标签体系设计原理、用户标签的制作方法、标签体系的用户画像应用、实战案例:用户行为在营销活动的价值分析、自动预警指标推送功能框架的搭建、app静默用户触动分析
可完成电商、金融、互联网等行业的标签体系的设计与应用任务。如构建业务指标体系、构建用户画像等高价值工作。
掌握用户标签体系设计原、熟悉用户标签的制作方法、熟悉用户画像的应用
数据挖掘概要、数据挖掘方法论、基础数据挖掘技术、进阶数据挖掘技术
理解和辨别数据挖掘算法在企业不同的工作场景中的应用,
熟悉数据挖掘的基本理论与技术
特征工程概要、特征建构、特征选择、特征转换、特征学习
正确理解特征工程,为提高模型效果,正确使用特征工程方法做准备
熟悉特征工程概念与原理;掌握特征工的构建,特征工的选择、转换
KNN-最近邻分类算法:原理、实现、决策树(分类树及回归树)、聚类分析
本阶段课程学习基础机器学习算法,有分类算法与聚类算法。这些算法可应用在大部分的商业问题中:如信用评分、客户画像等。
掌握KNN算法原理与基于Python的应用;掌握决策树算法原理、scikit-learn应用以及算法优化技巧;掌握K-means聚类算法原理及应用;熟悉保险行业客户分群意义;掌握决策树算法在客户分群中的实际运用;
朴素贝叶斯、神经网络与深度学习、支持向量机、集成方法 实战案例:航空客户价值分析综合案例、基于集成算法的乳腺癌疾病预测、基于神经网络的汽车燃油率预测
本阶段课程学习高阶机器学习算法与集成算法,这些算法在企业内的应用也比较多,如客户流失预警、动态定价、客户细分、欺诈检测、垃圾邮件检测、图像分类与识别等。
掌握朴素贝叶斯算法原理与应用;掌握常见神经网络算法的原理与应用;掌握SVM算法原理与应用,常见集成算法的原理;熟悉xgboost 、LightGBM算法原理;通过案例熟悉相关行业背景知识,并熟练运用算法;
关联规则、序列模式、模型评估、实战项目:推荐系统实战
掌握推荐系统主要的算法,并能依据模型结果提供实际营销建议。
掌握关联规则的核心原理与应用;掌握序列算法的原理及应用; 熟悉模型评估算法;掌握模型评估算法原理及应用
实战案例:以自动机器学习技术开发银行业信用风险评分模型并进行最佳模型调参、以类别不平衡处理技术开发银行业中小企业信贷营销模型并进行最佳模型调参、以半监督式学习技术开发电信业客户流失模型并进行最佳模型调参
可完成电商、金融、互联网等行业中的分类、预测问题,如用户购买预测、垃圾邮件检测、商品精准推荐等等。
掌握自动机器学习原理;熟悉类别不平衡问题的解决方法;掌握半监督学习算法原理与应用,模型优化技巧
自然语言处理概要、分词与词性标注、文本挖掘概要、关键词提取
可解决工作中自然语言处理相关问题,如舆情监控、用户情感分析、语义分析、KOL画像等工作。
熟悉自然语言处理的基本概念;掌握分词以及词性标注技术,文本挖掘技术流程方法,信息检索技术
实战案例:金融信用评分卡风控建模综合项目实战、以特征工程技术开发文本情感分析模型、以深度学习技术开发银行业信用卡盗刷侦测模型、以图像处理技术、深度学习及迁移学习技术,开发人脸口罩侦测模型
通过课程的学习,能完成评分卡建模、情感分析模型构建、信用卡盗刷侦测相关工作能力 。
综合使用机器学习、深度学习、自然语言处理算法来解决金融、银行、AI科技等行业的场景应用。
职业规划、职场沟通力、团队协作力培养
了解职业现状和前景,解决职业沟通和团队协作问题
专职职业导师培养职业规划、职场沟通、以及团队协作能力。
1V1面试技巧指导、简历修改
解决面试技巧不足、简历书写不专业问题
专职就业老师1V1面试技巧辅导与简历修改指导。
何为数据产品经理?Python爬虫、Python办公自动化、数据挖掘项目选修项目
解决学员在不同数据岗位方向和行业方向的业务经验和项目经验不足的问题。
根据学员面试方向、就业方向来选择合适的选修课程来进一步进修。
对口专业,高校数据科学、
统计相关专业在校生
职场晋升,从事数据相关岗位,
遇到职场晋升瓶颈
计算机相关
专业转行人群
喜欢钻研
数据科学的人群
涵盖行业中的各个场景,运用自动机器学习技术、类别不平衡处理技术、半监督式学习技术、特征工程技术、深度学习技术、图像处理技术、
深度学习及迁移学习技术等前沿挖掘模型,处理风控、信贷、客户流失、情感分析、人脸侦测等广泛的行业应用.
以自动机器学习技术开发银行业信用风险评分模型并进行最佳模型调参案例本项目将介绍如何将机器学习中的数据预处理、特征选择、算法选择、模型优化等步骤,将其放在一个“黑箱”里,通过黑箱,我们只需要输入数据,就可以得到我们想要的模型预测结果。学习并掌握自动机器学习的模型建构方法,并以银行业信用风险评分为例,进行信用风险评分模型的自动化。
以类别不平衡处理技术开发银行业中小企业信贷营销模型并进行最佳模型调参案例本项目将介绍多个类别不平衡的处理方法,以有效地对少数类别做正确的预测,帮助组织制定适当的决策,并节省许多成本与损失。学习并掌握多个目标类别分布不平衡的处理方法,并以银行业中小企业信贷营销为例,进行信贷营销模型的开发。
以半监督式学习技术开发电信业客户流失模型并进行最佳模型调参案例,本项目将介绍多个半监督式学习的方法,从未标记目标字段的数据中,找出一些模型比较有把握的预测结果当作目标字段的标记,以提升整体分类模型的预测效能。
本项目将介绍多个特征工程的技术,从原始数据中,构建、提取、并选择好的特征,并建置一个文本情感分析预测模型。学习并掌握多个特征工程的技术,并以文本情感分析预测为例,进行情感分析预测模型的开发。
本项目将通过利用信用卡的历史交易数据,进行机器学习,构建信用卡反欺诈预测模型,提前发现客户信用卡被盗刷的事件。学习并掌握常见信用卡盗刷的种类及信用卡盗刷的侦测的方法。学习信用卡盗刷的业务逻辑,发现关键业务结点,并掌握深度学习的建模能力。
本项目将以图像处理技术并结合深度学习及迁移学习,开发人脸口罩侦测模型。学习并掌握图像处理、深度学习及迁移学习的技术,并以人脸口罩侦测为例,进行人脸口罩侦测模型的开发。
解析数据分析业务全流程 厘清数字化人才技能需求
课程讲师均为国内数据挖掘领域、人工智能领域、咨询领域一线专家,具备深厚的学术背景与行业经验。
同时他们也都具备丰富的讲课经验,累计讲课经验时长超过10000小时,授课能力得到长期实践与验证。
课程依据大量不同行业、不同岗位的企业内训需求,结合主流的数据体系进行课程研发,课程内容更符合市场需求
课程的底蕴来自企业的信赖,上百家企业需求提炼,课程更贴合企业诉求。
自2015年以来,我们已为超过百家企业提供了内训服务,见证了企业从数据分析中实现真正价值的全过程,越来越多的企业要求全员掌握数据化思维,对数据人才需求十分迫切。
课程大纲依据 CDA 的 「EDIT数字化人才模型」设计研发。CDA是数据人才认证标准,在国内由中成协大数据专业委员会监管
并是经国标委发布认定的数据分析师人才标准
该模型体现层次和纵深两个方面
层次方面:强调战略、管理、操作三个层级的业务部门人员均借助数据支持创造性的优化业务流程。 纵深方面:以数据使用区分企业的前、中、后台,数据用户即业务人员,数据加工者即技术人员。
专业度
师资
授课形式
讲师经验
课程内容
课程体系
内容覆盖理论
内容覆盖行业
项目课
课程迭代
学习效果
IT培训机构临时开设课程
本科IT程序员为主
视频自学,有惑难解
以软件开发经验为主,与数据科学相关性不大
无授课经验或IT开发授课经验为主
工具堆砌
课程内容东拼西凑不成体系
机器学习为主
互联网企业为主
视频自学与视频直播为主
无
视频自学一年,不敢面对岗位
学员综合素质测评
定制专属职业路径规划
发放预习视频
课前预习督导
学情回访督学
班组长会议
关怀学员会议
班级会议
建立学员成长日记
意见收集反馈
1v1答疑
阶段测试
共性问题串讲
面试中技术支持
CDA 数据人脉圈
猎头内推服务
免费CDA活动
免费资料
项目众包
简历优化
面试教练
职业咨询
面试邀约
市场趋势分析
简历指导
数据分析业务流
面试技巧
万人报名
千人参加
行业大咖
尽情交流
专属实名制社群
线上线下不定期分享
分享适合你的
数据分析报告
领域研习交流
行业大牛讲座
技术大牛分享
紧跟科技前沿
上百家企业
猎头对接
助力职场晋升
突破职业瓶颈