-
大数据课程大纲精准营销系统功能架构图精准营销系统技术架构图
-
大数据课程大纲标签/画像系统功能架构图标签/画像系统技术架构图
-
大数据课程大纲BI/报表系统功能架构图BI/报表系统技术架构图
2个月快速入门,从零进阶,业界名师高效传授实用技能,
学完课程后相当于掌握了大数据经典书本精华知识,让你毕业即有3年行业项目经验,拓展人脉圈子
北京大学博士,曾担任毕马威咨询大数据部总监,ThoughtWorks首席数据科学家。
任国富如荷教研部课程主管,参与了多门数据挖掘、大数据分析相关课程及教材的设计与开发工作。
CDA数据科学研究院讲师曾服役于原总参指挥自动化站。后就职于北京市永安商业公司
CDA数据科学研究院讲师曾就职于百度移动生态事业群组(MEG)销售体系直销分公司,任数据分析师
CDA数据科学研究院讲师统计学专业,曾就职于卡牌游戏、跨境电商等行业担任数据分析师
1、考察Linux基本知识掌握情况;2、考察Java基本知识掌握;3、考察SQL基本知识掌握
【Linux基础】
1.计算机基础知识讲解、Linux的安装与设置
2.常用生产工具介绍(xshell、ftp工具)
3.常用系统命令介绍(文件操作命令、系统管理命令、网络管理命令、权限管理命令)
4.shell编程、awk、sed的使用
5.Linux系统软件管理命令、任务管理crontab
【Java编程基础】
1.Java基本介绍、常用语法规范、开发环境部署、常量与变量、数据类型与运算符、流程控制语句、方法、数组
2.面向对象编程思想、类与对象概念及定义、常见类及其用法
3.数据结构、List、Set、Map数据类型介绍、反射机制、JDBC、Maven
【SQL编程基础】
1.列出数据、筛选数据、计算新变量、汇总数据
2.多表横向合并、多表纵向合并
3.子查询
1、考察Linux基本知识掌握情况 2、考察Java基本知识掌握 3、考察SQL基本知识掌握
1、Linux 考试
2、Java 考试
3、SQL考试
1、商业智能应用2、MySQL深度性能优化3、商业智能数据架构及平台搭建 4、商业智能可视化
【商业智能应用】
商业智能、报表的商业价值
商业智能、报表应用场景与现状
MySQL电商数据分析案例
【MySQL深度性能优化】
MySQL数据库框架
数据库服务器性能
数据类型优化
索引优化
查询性能优化
MySQL高级特性
优化服务器设置
可扩展的MySQL
高可用性
应用层优化
【商业智能数据架构及平台搭建】
商业智能系统技术架构解讲解
Hadoop、Hive、Sqoop原理讲解
商业智能系统数据平台搭建
高速公路收费数据案例讲解
1、标签开发一2、hive性能优化3、标签开发二 4、标签开发三5、标签数据的存储和查询
【标签开发一】
数据应用体系层级划分
大数据精准营销架构
标签体系整体框架
基础标签
统计标签、规则类标签及Hive实践
【hive性能优化】
1、妙用Hive视图功能
2、Hive索引的使用
3、使用EXPLAIN优化查询代码
4、limit限制调整优化
5、join优化
6、调整mapper与reducer个数
【标签开发二】
scala基础(1day):
1、scala开发环境配置
2、值与变量
3、常用数据类型
4、方法定义
5、条件表达式与循环
6、Lazy value的应用
7、数组、元组与Map
8、类、抽象类、特质
9、模式匹配、样例类
10、文件访问
文本标签(1day):
1、Spark简介
2、SparkML简介
3、SparkML Piplines
4、SparkML特征(文本)提取、转换、加载
5、文本提取案例:用户评论情感标签提取
【标签开发三】
算法标签
机器学习基础
回归:线性回归与SparkML特征处理
分类:逻辑回归及Spark实现
聚类:Kmeans及Spark实现
复杂网络:图计算
算法实战:营销预测案例
【标签数据的存储和查询】
标签数据的应用场景及存储需求分析
Hive、Hbase、Elasticsearch等在标签数据存储中的应用
1、流式计算开发2、实时计算系统3、实时精准营销行业案例分析 4、推荐系统5、数据中台的大数据架构
【流式计算开发】
流式计算概述
Spark Streaming的架构原理
Dstream操作(转换、输出)
Spark Streaming外部数据源介绍
Structured Streaming原理及编程模型
Kafka原理及应用讲解
【实时计算系统】
flink部署与使用
flink运行架构分析
DataStream与DataSet
TableAPI&SQL
flink状态机制
【实时精准营销行业案例分析】
决策树
集成算法(随机森林)
机器学习算法与flink的连接
实时精准营销案例及代码实践
【推荐系统】
推荐系统概述
冷启动与EE问题
精细化运营与推荐系统
推荐算法-协同过滤
【数据中台的大数据架构】
大数据架构
数据中台
1、docker技术架构原理及相关命令2、docker容器数据卷及应用部署 3、docker私有仓库相关技术docker实操
【docker技术架构原理及相关命令】
一、Docker核心命令
1、Docker简介、什么是Docker、Docker应用场景
2、Docker架构
3、Docker引擎、仓库、镜像、容器等概念
4、Docker安装、卸载
5、Docker配置镜像加速器
6、Docker镜像管理
7、Docker容器管理
8、Docker复制
9、Docker查看日志命令
10、Docker数据卷
二、常用软件安装
1、Docker安装Nginx
2、Docker安装MySQL
3、Docker安装Redis
4、Docker安装RabbitMQ
【docker容器数据卷及应用部署】
三、镜像制作Dockerfile
1、Dockerfile常用命令
2、Dockerfile实战案例(4个案例)掌握全方面Dockerfile编写
3、官方镜像Tomcat源码解析(Dockerfile)
4、Docker部署SpringBoot微服务项目,微服务镜像制作
四、Docker-compose简介与安装
1、快速部署分布式应用(实现动态扩容、资源高效利用)
2、Docker-compose之Tomcat集群搭建
3、Docker-compose之Redis集群搭建
增加作业练习与测试,保障学习效果
定期进行直播串讲,攻克重难点知识
朝九晚九跟班答疑、 5分钟有问必答、定期学习困难问诊,用心关怀每位学员学习状态
与优秀的人同行,走进数据人的职场圈子
根据你的发展意愿与竞争力,为你规划职业方向、确定求职目标
就业老师全程定制化辅导,模拟1v1面试结果进行分析、总结
听取前辈们的求职经验,深入了解行业与企业、摸清自身职业发展路径
A: CDA大数据就业班最新课程采用基础班+进阶课程+案例实战,每天6小时上课和2小时晚自习,赠送全套录播视频可以反复观看,学习中的疑问也有内部交流群。
A: 远程班采取直播平台+ 线上答疑,同步现场班上课时间,错过直播学员可以观看视频。
A: CDA大数据课程每期都会建立QQ群和微信群,工作日有老师和助教负责答疑;同时学员可以在讨论区以帖子的形式向老师提问,老师会在工作日内回复。
A: 首先,我们有一次免费学习的机会,如果还是学不会,授课老师会和学生面谈,发现问题所在,并让老师给出学习建议,查缺补漏,可以再跟着免费学一期。目前咱们还没有出现过这样的情况,对于学员来讲都是想尽快掌握技术能够运用到工作中。
A: 现场和远程学员推荐就业,我们课程设计就是以就业为导向。安排专职就业老师,从就业指导、面试模拟、毕业答辩会等全方面服务,保障学员的就业问题。
A: 大数据软件使用版本如下: centos 7.2、hadoop-2.6.0、hive-1.1.0、sqoop-1.4.6、hbase-1.2.0、spark-2.3.0、zookeeper-3.4.5、Anconda5.2.0及以上、Oracle VM VirtualBox6 或者VMware
A: 学习大数据课程计算机内存推荐为 16G (享受飞驰的感觉),至少8G。CPU推荐四核八线程的、硬盘可用空 间100G。关于内存是考虑了spark对内存的需求较大,大数据其他组件内存需求会低一些。关于开发工具:推荐pyspark使用jupyter notebook,Scala使用 IntelliJ IDEA 社区版,python脚本可以使用pycharm。
A: Hadoop架构基于java程序设计,因此大批的IT人士在大数据时代找到了自己的职业锚,而且最快的进入了这个行业,成为了最先的大数据分析师。但IT人士的宿命就在于他们太IT了,他们热衷于计算更快、处理更高效的程序设计,而忽略了大数据分析的本意,为企业带来商业价值,因此他们只能是大数据分析工程师,而正真的大数据分析师应当了解和熟悉hadoop技术架构和算法设计,但不必成为一个优秀的JAVA程序员。
A: 普通的数据分析师具有一定的数理统计基础,熟悉业务逻辑,能熟练地操作传统的数据分析软件,能使数据成为企业的智慧。他们通常遇到的都是一些结构化、体量小的小数据。而大数据分析师更专注数据获取的架构设计、数据分析模型的选择、指标的选取,他们具有数据分析师的理论素养和业务能力,面对大数据,他们有一整套分布式的数据获取、整理、处理和分析的方案,而且这个方案最终的目标是为数据分析服务,他们具有大数据分析的利器,如Hadoop、Spark等软件。