2018-11-21
阅读量:
1968
列联表和卡方检验
分类变量之间的相关性一般可以采用列联表分析或卡方检验的方法来进行验证。
列联表是两个分类变量的分类水平之间形成的交叉频数表,通过计算行百分比或列百分比,对实际频率和期望频率进行对比分析,例如一个典型的列联表如下:
对于表中频数、期望频数、行/列百分比的解读方法要熟练掌握。比如98代表的是头发颜色为金色,眼睛颜色为深色的样本数量。而355.2则是期望的数量。6.7%是行百分比,也就是在所有头发颜色为金色的样本中,眼睛颜色为深色的占比。
列联表是一种比较简单的描述性统计方法,而卡方检验则可以通过量化的方法对两个分类变量的相关性进行检验,卡方统计量如下:
其中O是观察到的频数,E是期望的频数,可以看到卡方检验关注的就是统计样本实际观测值与期望值之间的偏离程度。卡方值越大,说明偏离越大,也就是实际观测值越不符合期望。如果卡方值等于0,这说明观测结果和期望完全相符。卡方检验是一种用途非常广的假设检验方法。
另外卡方检验的结果与分类变量的顺序无关,将任意两行进行互换,卡方值不变。
0.0000
0
0
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
0条评论
0条评论
1条评论