SPSS操作:多个相关样本的非参数检验(Cochran's Q检验)
一、问题与数据
某康复科医生拟评价康复训练对卒中后患者体能恢复的效果。患者分别在开始康复、康复3个月和康复6个月时进行体能测试。为了保证一致性,三次体能测试内容是一样的,体能测试的结果为“通过”和“不通过”。该医生想知道卒中后患者体能测试的结果为“通过”的比例是否一直上升。
该研究随机选取了63例进行康复训练的卒中后患者,并收集了所有研究对象的开始康复时的体能测试结果 (initial_fitness_test),康复3个月时的体能测试结果 (month3_fitness_test)和康复6个月时的体能测试结果 (final_fitness_test)。结果均为“通过(Passed)”和“不通过(Failed)”的形式(分别赋值为1和2)。部分数据如下图。
其中,Individual scores for each paticipant列出了每一个研究对象的情况,而Total count data (frequencies)则是对相同情况研究对象的数据进行了汇总。
二、对问题的分析
要检验三组或多组相关样本中,分类变量是否存在差异,可以使用Cochran's Q 检验,但需要考虑以下4个假设。
假设1:结局变量为二分类,且两类之间互斥。互斥是指一个研究对象只能在一个分组中,不可能同时出现在两个组中。例如 “安全”和“不安全”,“及格”和“不及格”等。
假设2:分组变量包含3个及以上分类,且各组之间相关。(当分组变量只有2个分类时,可使用McNemar’s检验)
假设3:样本是来自于研究人群的随机样本。然而实际中,样本并非都是随机样本。
假设4:样本量足够。当样本量n≥4且nk≥24(k为分组变量数)时,可以采用Cochran's Q检验;否则采用“精确” Cochran's Q检验。
本研究中,结局变量有两个分组且互斥(“通过”和“不通过”),符合假设1;分组变量包含3个分类(开始康复、康复3个月和康复6个月时),各组之间相关,符合假设2;研究对象是随机选取,符合假设3。
那么应该如何检验假设4,并进行比较呢?
三、SPSS操作
3.1 检验假设4:样本量足够
1. 转换数据格式
如果原始数据格式是Total count data (frequencies),则可以跳过此步。如果原始数据格式是Individual scores for each paticipant,则需要将数据转换成Total count data (frequencies)格式。
在主界面点击Data→Aggregate,出现Aggregate Data对话框。将变量initial_fitness_test、month3_fitness_test和final_fitness_test选入Break Variable(s)框中。
点击下方Number of cases框,并在Name框中填入“freq”。在Save下方勾选Create a new dataset containing only the aggregated variables,并在Dataset name框中填入新数据集的名字(例如“cochran_q_freq”)。
点击OK,产生新数据集。在新数据集中,可以看到新变量“freq”,代表每一种自变量组合的频数。
2. 数据加权
使用Total count data (frequencies)格式数据,并在主界面点击Data→Weight Cases,弹出Weight Cases对话框后,点击Weight cases by,激活Frequency Variable窗口。将freq变量放入Frequency Variable栏,点击OK。
3. 计算样本量
本研究的总样本数N=63,但计算Cochran's Q 检验的样本量时,需要减去三次测试结果都一致的样本数。如下突出显示所示,全部为“Failed”有20例,全部为“Passed”有7例,所以三次测试结果都一致的样本数为20+7=27,Cochran's Q 检验的样本量n=63-27=36。
其次,需要确定nk的大小。由于本研究共有三个分组,所以k=3,nk=36*3=108。
综上,n≥4且nk≥24,符合假设4。
3.2 计算比例
在主界面点击Descriptive Statistics→Frequencies,在Frequencies对话框中,将变量initial_fitness_test、month3_fitness_test和final_fitness_test选入Variable(s):框中,点击OK。
3.3 符合假设4的Cochran's Q检验
在主界面点击Analyze→Nonparametric Tests→Related Samples,出现Nonparametric Tests: Two or More Related Samples对话框。确认在What is your objective?区域勾选了Automatically compare observed data to hypothesized。
点击Fields,将变量initial_fitness_test、month3_fitness_test和final_fitness_test选入Test Fields框中。
点击Settings→Customize tests,勾选Cochran's Q (k samples)。
点击Define Success,在Cochran's Q: Define Success对话框中,点击Combine values into success category,在Success框中填入1(这里是“成功”对应的编码,本例中即为通过体能测试,“Passed”对应的是1,所以这里填“1”)。
点击OK→Run,输出结果。
3.4 不符合假设4的“精确”Cochran's Q检验
当不符合假设4时,需要使用“精确”Cochran's Q检验。在主界面点击Analyze→Nonparametric Tests→Legacy Dialogs→K Related Samples,出现Tests for Several Related Samples对话框。
将变量initial_fitness_test、month3_fitness_test和final_fitness_test选入Test Variables框中。在Test Type 下方去掉Friedman,然后勾选Cochran's Q。(如果数据符合假设4,则此时点击OK,结果与3.3部分的操作结果一致)
点击Exact,在Exact Tests对话框中,点击Exact,点击Continue→OK。
3.5 “精确”Cochran's Q检验后的两两比较
对于符合假设4的Cochran's Q检验(3.3部分),事后的两两比较将在结果解释部分展示(4.2部分)。
对于不符合假设4的“精确”Cochran's Q检验(3.4部分)事后的两两比较,可采用经Bonferroni法校正的多重McNemar检验。
在主界面点击Analyze→Nonparametric Tests→Legacy Dialogs→2 Related Samples。在Two-Related-Samples Tests对话框中,依次选择两两比较的变量,分别将变量initial_fitness_test和month3_fitness_test、变量initial_fitness_test和final_fitness_test、变量month3_fitness_test和final_fitness_test选入右侧Test Pairs中。 去掉Test Type下方的Wilcoxon,勾选McNemar。
点击Exact,在Exact Tests对话框中,点击Exact,点击Continue→OK。
四、结果解释
4.1 统计描述
3.2部分的操作后,得到的频数结果见下图。康复开始、康复3个月和康复6个月时培的体能测试的通过率分别为22.2%、44.4% 和 60.3%。
4.2 符合假设4的Cochran's Q检验及事后两两比较
3.3部分的操作后,得到Cochran's Q检验的结果如下图。
上图中,第一列(Null Hypothesis)是本研究的零假设。第二列(Test)显示本研究的假设检验方法,即Cochran's Q检验。第三列(Sig.)是假设检验的统计结果,即P值。第四列(Decision)是根据假设检验做出的判断,即判断是否拒绝零假设。
本研究Cochran's Q检验的P<0.001,拒绝零假设。即开始康复、康复3个月和康复6个月时,研究对象体能测试结果的差异具有统计学意义。
双击该表,SPSS会自动弹出Model Viewer界面,帮助我们进一步了解Hypothesis Test Summary表的结果。
Cochran's Q检验统计量服从自由度为k-1的 χ2分布。本研究的统计量为24.222,此时统计量可记为 χ2 = 24.222, P<0.001。
在该视图下方的View的下拉选项框中,选择“Pairwise Comparisons”,可以得到两两比较的结果。两两比较的方法为Dunn’s检验(经Bonferroni法校正)。
在Pairwise Comparisons图中(此处略),连接线代表两两比较的结果,黑色连接线代表两组间差异无统计学意义,橘黄色连接线代表两组差异具有统计学意义。
下方的表格(如下图)给出了更多的信息:比较的组别、统计量、标准误、标准化的统计量(=统计量/标准误)、P值和调整后的P值。
由于是事后的两两比较(Post hoc test),因此需要调整显著性水平(调整α水平),作为判断两两比较的显著性水平。依据Bonferroni法,调整α水平=原α水平÷比较次数。本研究共比较了3次,调整α水平=0.05÷3=0.0167。因此,最终得到的P值(上图中Sig.一列),需要和0.0167比较,小于0.0167则认为差异有统计学意义。
另外,SPSS也提供了调整后P值(上图中Adj. Sig.一列),其思想还是采用Bonferroni法调整α水平。该列是将原始P值乘以比较次数得到,因此可以直接和0.05比较,小于0.05则认为差异有统计学意义。
以上结果可以描述为:康复开始和康复3个月时研究对象体能测试结果的差异有统计学意义(调整后P=0.013),康复开始和康复6个月时研究对象体能测试结果的差异有统计学意义(调整后P<0.001),而康复3个月和康复6个月时研究对象体能测试结果的差异无统计学意义。
4.3 不符合假设4的“精确”Cochran's Q检验
3.4部分的操作中,既可以得到Cochran's Q检验的结果,也可以得到“精确”Cochran's Q检验的结果(取决于是否选择Exact选项)。
结果如下图。在Test Statistics表格中,左侧是Cochran's Q检验结果,右侧是“精确”Cochran's Q检验结果。
如果数据符合假设4,则Cochran's Q检验统计量服从自由度为k-1的 χ2分布。左侧表格中的P值为“Asymp. Sig.”所对应的“0.000”,即P<0.001。本研究的统计量为24.222,此时统计量可记为 χ2 = 24.222,P<0.001。
如果数据不符合假设4,则右侧表格中的P值为“Exact. Sig.”所对应的“0.000”,即P<0.001。本研究的统计量为24.222,此时统计量可记为Cochran's Q = 24.222, P<0.001。
4.4 “精确”Cochran's Q检验后的两两比较
当不满足假设4时,3.5部分的操作可得到经Bonferroni法校正的多重McNemar检验的结果。
由于是事后的两两比较(Post hoc test),因此需要调整显著性水平(调整α水平),作为判断两两比较的显著性水平。依据Bonferroni法,调整α水平=原α水平÷比较次数。本研究共比较了3次,调整α水平=0.05÷3=0.0167。因此,最终得到的P值(上图中Exact Sig. (2-tailed)一行),需要和0.0167比较,小于0.0167则认为差异有统计学意义。
以上结果可以描述为:康复开始和康复3个月时研究对象体能测试结果的差异有统计学意义(P=0.007),康复开始和康复6个月时研究对象体能测试结果的差异有统计学意义(P<0.001),而康复3个月和康复6个月时研究对象体能测试结果的差异无统计学意义。
五、撰写结论
1. 符合假设4时(即样本量足够)
开始康复、康复3个月和康复6个月时,卒中后患者体能测试的通过率分别为22.2%、44.4%和60.3%。运用Cochran's Q 检验对三个时间点体能测试通过率进行检验,三个时间点通过率的差异具有统计学意义,χ2 = 24.222, P<0.001。
采用Dunn’s检验(经Bonferroni法校正)进行事后的两两比较,康复开始和康复3个月时研究对象体能测试结果的差异有统计学意义(调整后P=0.013),康复开始和康复6个月时研究对象体能测试结果的差异有统计学意义(调整后P<0.001),而康复3个月和康复6个月时研究对象体能测试结果的差异无统计学意义(调整后P=0.124)。
2. 不符合假设4时
开始康复、康复3个月和康复6个月时,卒中后患者体能测试的通过率分别为22.2%、44.4%和60.3%。运用Cochran's Q 检验对三个时间点体能测试通过率进行检验,三个时间点通过率的差异具有统计学意义, Cochran's Q = 24.222, P<0.001。
运用“精确”McNemar’s检验进行事后的两两比较(经Bonferroni法校正的α=0.0167)。康复开始和康复3个月时研究对象体能测试结果的差异有统计学意义(P=0.007),康复开始和康复6个月时研究对象体能测试结果的差异有统计学意义(P<0.001),而康复3个月和康复6个月时研究对象体能测试结果的差异无统计学意义(P=0.031)。
数据分析咨询请扫描二维码
在数据分析领域,尽管行业前景广阔、岗位需求旺盛,但实际的工作难度却远超很多人的想象。很多新手初入数据分析岗位时,常常被各 ...
2024-12-19入门数据分析,许多人都会感到“难”,但这“难”究竟难在哪儿?对于新手而言,往往不是技术不行,而是思维方式、业务理解和实践 ...
2024-12-19在如今的行业动荡背景下,数据分析师的职业前景虽然面临一些挑战,但也充满了许多新的机会。随着技术的不断发展和多领域需求的提 ...
2024-12-19在信息爆炸的时代,数据分析师如同探险家,在浩瀚的数据海洋中寻觅有价值的宝藏。这不仅需要技术上的过硬实力,还需要一种艺术家 ...
2024-12-19在当今信息化社会,大数据已成为各行各业不可或缺的宝贵资源。大数据专业应运而生,旨在培养具备扎实理论基础和实践能力,能够应 ...
2024-12-19阿里P8、P9失业都找不到工作?是我们孤陋寡闻还是世界真的已经“癫”成这样了? 案例一:本硕都是 985,所学的专业也是当红专业 ...
2024-12-19CDA持证人Louis CDA持证人基本情况 我大学是在一个二线城市的一所普通二本院校读的,专业是旅游管理,非计算机非统计学。毕业之 ...
2024-12-18最近,知乎上有个很火的话题:“一个人为何会陷入社会底层”? 有人说,这个世界上只有一个分水岭,就是“羊水”;还有人说,一 ...
2024-12-18在这个数据驱动的时代,数据分析师的技能需求快速增长。掌握适当的编程语言不仅能增强分析能力,还能帮助分析师从海量数据中提取 ...
2024-12-17在当今信息爆炸的时代,数据分析已经成为许多行业中不可或缺的一部分。想要在这个领域脱颖而出,除了热情和毅力外,你还需要掌握 ...
2024-12-17数据分析,是一项通过科学方法处理数据以获取洞察并支持决策的艺术。无论是在商业环境中提升业绩,还是在科研领域推动创新,数据 ...
2024-12-17在数据分析领域,图表是我们表达数据故事的重要工具。它们不仅让数据变得更加直观,也帮助我们更好地理解数据中的趋势和模式。相 ...
2024-12-16在当今社会,我们身处着一个飞速发展、变化迅猛的时代。不同行业在科技进步、市场需求和政策支持的推动下蓬勃发展,呈现出令人瞩 ...
2024-12-16在现代商业世界中,数据分析师扮演着至关重要的角色。他们通过解析海量数据,为企业战略决策提供有力支持。要有效完成这项任务, ...
2024-12-16在当今数据爆炸的时代,数据分析师是组织中不可或缺的导航者。他们通过从大量数据中提取可操作的洞察力,帮助企业在竞争激烈的市 ...
2024-12-16在现代企业中,数据分析师扮演着至关重要的角色。他们不仅负责处理和分析大量的数据,还需要将这些分析结果转化为切实可行的商业 ...
2024-12-16在当今的大数据时代,数据分析已经成为推动企业战略的重要组成部分。无论是金融、医疗、零售,还是制造业,各个行业对数据分析的 ...
2024-12-16在当今这个以数据为驱动力的时代,数据分析领域正在迅速扩展与发展。随着大数据、人工智能和机器学习技术的不断进步,数据分析已 ...
2024-12-16在信息爆炸和数据驱动的时代,数据分析专业是否值得一选成为许多人思考的议题。无论是刚刚迈入大学校门的新生,还是考虑职业转型 ...
2024-12-16适合数据分析专业学生的实习岗位有很多,以下是一些推荐: 阿里巴巴数据分析岗位实习:适合经济、统计学、数学及计算机专业的 ...
2024-12-16