2018-12-28
2018年12月21-25日,CDA数据分析研究院在金拱门(中国)有限公司进行了一场以“数据科学应用”为主题的内训。上海总部各部门报名人数超出预期,共有50名员工参加了培训。老师和数据分析部门的相关同事进行积极地交流,本次内训取得圆满成功。
内训大纲:
第一阶段:Python编程和数据整理精要
1.数据结构(list, dictionary,tuple等)
2.循环结构(对文本的遍历)、使用函数
3.数组、numpy和pandas等
案例:
顾客就餐优惠券收集问题、顾客自回避随机行走问题、顾客的正态分布函数问题
统计外卖订单的字符个数、租房价格的分类汇总、足球运动员的数据清洗和整理等
第二阶段:抽样分布、假设检验和Logistic回归模型
1.抽样分布、随机过程和随机模拟,均值比例的参数统计和假设检验
2.分类变量的处理、模型的参数估计(掌握极大似然估计)
3.系数和结果的解释、拟合优度、预测等
案例:
顾客排队系统的泊松流分析、产品质量的假设检验等
不同年龄、性别的顾客购买意向分析、食品饮料机发生故障的次数分析等
第三阶段:主成份分析和时间序列模型
1.主成份分析的原理、降维、综合评价方法
2.时间序列数据的预处理、平稳时间序列的检验方法、差分
3.自相关与偏自相关系数、模型识别、参数估计
4.模型检验、模型优化、模型预测和分析等
案例:
某零售商为了研究其某款产品的销售情况,收集了销售额月度数据,根据此数据作时间序列分析和预测
完 谢谢观看