热线电话:13121318867

登录
首页精彩阅读【从零开始学统计】6.通俗理解T和F检验
【从零开始学统计】6.通俗理解T和F检验
2014-07-04
收藏
       T检验是统计推断中常用的一种检验方法,在统计分析中,它主要用于检验参数的显著性。前一次,我们已经讲了假设检验的一些初步知识,那么这些T检验啊F检验啊,都是建立在假设检验的基础上的。
首先我们简单了解一下什么是T检验
       T检验是最常见的一种假设检验类型,主要验证总体均值间是否存在显著性差异,属于参数假设检验,所以它适用的范围是数值型的数据。T检定改进了Z检验。在样本数量大(超过30等)时,可以应用Z检定,但Z检定用在小的样本会产生很大的误差,因此样本很小的情况下得改用T检验。
       T检验需要符合两个个条件——总体符合正态分布,n < 30。当n>30时用Z检验或者T检验均可,此时用Z检验较简单。
       T检验分为单样本和双样本两类,单样本检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布。检验统计量为: 单样本.jpg 


双样本检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体tt检验又分为两种情况,一是独立样本T检验,一是配对样本T检验,两者的检验统计量分别为:两样本独立公式.jpg 配对公式.jpg 

做T检验的一般步骤为:
步骤1 — 提出假设
步骤2 — 确定假设的显著水平α,
步骤3 — 求两尾概率t,即:在无效假设H0成立的前提下,计算无效假设正确的概率,也称差异由误差引起的概率。
步骤4 — 作统计判断,确定接受和否定哪一个假设。

结合这之前的假设检验,我们来做一个简单的单样本T检验例题:
例1 难产儿出生体重。N=35,样本均值=3.42, S=0.40,一般婴儿出生体重μ0=3.30(大规模调查获得),问相同否?
    解: H0:μ= μ0,难产儿与一般婴儿体重相同
         H1:μ≠ μ0,难产儿与一般婴儿体重不同
         计算检验统计量: 例题计算公式.jpg 




查找相应临界值表,查表得,t0.05 / 2.34 = 2.032,t < t0.05 / 2.34,不拒绝H0,认为两者体重相同。
例题作为一个引导,相对应的双总体检验就不在多述,大致步骤一样,只是公式换一换,临界值换一换而已。


当然,T检验不光光是能做这些,我们也还经常在做回归分析当中运用到它。在回归分析中,它主要用于检验回归系数的显著性。在回归分析中,原假设通常是H0:β=0;H1:β≠0。接下去的步骤就和例题一样了。
有人要问,为什么要做回归系数的检验?
我的答案是,做这个检验是为了验证x对y的影响程度是否显著。如果不拒绝原假设,则说明y与x之间没有线性关系(即x对y没有直接影响)。(上述针对的是一元回归)
若要做多元的回归,那情况则就复杂的多了(不光要逐个对参数系数做检验,还要模型整体检验,这就涉及到F检验了……)
都说到多元回归了,那就简单说说F检验了。聊起F检验,往往会闪过一个问题:T检验和F检验有什么区别?那我想最大的区别也许在于F检验基于的是方差(检验方差齐性),T检验则对应的是均值。(不知道这样的理解会否有些偏颇,敬请拍砖……)在两样本中,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用T检验,若不等,可采用t'检验或变量变换或秩和检验等方法。引申到回归分析中,T检验的就是各个参数与y的显著性,F检验则是对整个模型的显著性做检验。
对于初学者,可能还有一个问题就是F检验和ANOVA(方差分析)是什么关系?我的答案是方差分析和F检验基本是一致的,区别在于方差分析是一种分析思路,利用了F检验的统计量。
方差分析的基本思路又是什么?
我觉得基本思想就是将所有测量值间的总变异按照其变异的来源分解为多个部份,然后进行比较,评价由某种因素所引起的变异是否具有统计学意义。说到变异,我们可以把总的变异分为组间变异和组内变异(组间变异:各组的均数与总均数间的差异;组内变异:每组的每个测量值与该组均数的差异),离差平方和可分解为SS总=SS组间+SS组内,MS组间=SS组间/V组间;MS组内=SS组内/V组内。F统计量可表述为:F=MS组间/MS组内。
我们拿一张方差分析表来做一下分析:
<a href='/map/fangchafenxi/' style='color:#000;font-size:inherit;'>方差分析</a>图.jpg 
通常我们可以通过计算得到的F值去对应的临界值表中查找,然后判断是否拒绝原假设。不过有一个更直观的数据,那就是P值,从表中的P值,我们若选取α=0.05的话,此时的P值小于0.05,则拒绝原假设,认为其是有统计学意义的。

数据分析咨询请扫描二维码

最新资讯
更多
客服在线
立即咨询