1.1 数据分析步骤:
核心:数据
① 收集数据:
做调查问卷
爬虫
数据接入
② 处理数据
重复值
缺失值
异常值
数据编码
③ 分析数据
统计学的对象是数据
数据的形式
结构化数据
数字:所有可以用数字来描述的叫结构化数据,可以进行比较、加减乘除运算等。
非结构化数据
所有不可以用数字来描述的叫非结构化数据,如:文字、图像、声音、男女等。
3.1 数据的分类(常用)
3.2 数据的其他分类
直接来源(一手数据、原始资料)
间接来源(二手数据、次级资料)
观测的数据
饰演的数据
截面数据
时间序列数据
混合数据(面板数据)
离散型数据
不能无限细分的数据
连续型数据
可以无限细分的数据
虚拟变量数据/哑变量