推断统计
估计
均值、标准差包含了一组数据的大部分主要信息;我们可以借助均值、标准差进行进一步的估计。
参数估计:已知或假定分布。
非参数估计:未知且无法假定(常借用“秩”进行估计,即数据的大小顺序)。
参数估计的四步骤:
1.选定参数——确定需要估计的参数
2.选定统计量——确定估计参数的统计量
3.抽样分布——已知或假定模型分布
4.估计——得出结果
一.选定参数
1.总体均值的估计:单总体均值,两总体均值之差
2.总体比例的估计:单总体比例,两总体比例之差
3.总体方差(标准差)的估计:单总体方差,两总体方差之比
二.选定统计量
1.总体均值的估计:单总体均值,两总体均值之差
2.总体比例的估计:单总体比例,两总体比例之差
3.总体方差(标准差)的估计: 单总体方差, 两总体方差之比
三.抽样分布
1.总体均值的估计:单总体均值,两总体均值之差
(1)样本均值xbar的抽样分布(n的临界值为30)
(2)两样本均值之差x1bar-x2bar 的抽样分布
2.总体比例的估计:单总体比例 两总体比例之差
(1)样本比例 p 的抽样分布(np<5或n(1-p)<5的情况这里不予以考虑。)
(2)两样本比例之差p1 -p2 的抽样分布(np<5或n(1-p)<5的情况这里不予以考虑。)
3.总体方差(标准差)的估计:单总体方差 两总体方差之比
(1)样本方差 s 2 的抽样分布
(2)两样本方差之比 s1 2 /s2 2的抽样分布
评价估计量的三标准
(1)无偏性(2)有效性(3)一致性
四.估计
两类方法:
1.点估计
(1)定义:用样本估计量构造的某一个值直接作为总体参 数的估计值
(2)具体方法:矩估计法,最大似然法,顺序统计量估计法,最小二乘法。。。。。。
(3)特点:优点(简单、精确);缺点(不准确)
2.区间估计
(1)定义:在点估计的基础上,给出总体参数估计的一个
区间范围,该区间由样本统计量加减抽样误差而得到的,
得到的结果称为“置信区间”。
如何衡量区间对总体参数估计的准确性:
①总体的参数值总是存在的、且固定的,但是是未知的;
②不能说“某个区间以90%的概率包含总体参数”;也不能说总体参数 有90%的可能性落在某个区间。
(2)置信水平(confidence level)
在重复抽取的m个样本中,这m个样本构造的m个置 信区间包含总体参数值的个数占m的比例。
表示方法:(1-α),α为未包括总体参数的区间占所 抽取的所有区间个数的比例;
常用的置信水平值有99%,95%,90%。对应的α为 0.01,0.05,0.10。
(3)置信区间
指由样本统计量所构造的总体参数的估计区间。
暂无数据