统计学:一门收集、处理、分析、解释数据并从中得出结论的科学。
【步骤】
收集数据→处理数据→分析数据→解释数据
抓取 清洗 方法:两大类
爬数 (1)描述性分析方法
(2)推断性分析方法①估计
②假设检验
1、数据
(1)形式:
①数字:严格的数字上的符号
②文字:不可运算
核心区别:是否可以运算
(2)按计量尺度不同分类
①分类型
②顺序型(分类型中的一份子)
③数值型
Tips:①与②是文字型,又叫定性数据/品质数据;③是数值型,又叫定量数据,精确定位。
【结论】
①区间(分组的数值型数据)属于数值型;
②不同类型数据之间可以进行转换(高级→低级,反之不行);
③一个重要的规律:低级方法高级可以用,但高级方法低级不可用
☆方法:人提出来的。
(3)其他分类:
①按来源:直接来源和间接来源;
②按收集方式:观测的数据和实验的数据;
③按与时间的关系:截面数据、时间序列数据、混合数据(面板数据);
④特殊:虚拟变量数据
2、总体和样本
(1)总体:研究的所有元素的集合,每个元素成为个体;
(2)样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目成为样本容量;
样本推断总体。
3、参数和统计量
(1)参数:研究者想要了解的总体的某种特征值;
【e.g.】总体均值()、标准差()、总体比例(π)
(2)统计量:根据样本数据计算出来的一个量,即样本的某个特征值;
【e.g.】样本均值()、样本标准差(s)、样本比例(p)
4、变量
定义:指描述事物某种特征的概念。
【e.g.】商品销售额、受教育程度
变量的具体表现成为变量值,即数据。
分类:
①分类变量:说明事物类别的一个名称;
②顺序变量:说明事物有序类别的一个名称;
③数值型变量:说明事物数字特征的一个名称;








暂无数据