用SPSS进行单因素方差分析和多重比较-CDA数据分析师官网

用SPSS进行单因素方差分析和多重比较

2017-04-30

用SPSS进行单因素方差分析和多重比较

SPSS——单因素方差分析

单因素方差分析

单因素方差分析也称作一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水平分组中哪一组与其他各组均值间具有显著性差异进行分析，即进行均值的多重比较。One-Way ANOVA过程要求因变量属于正态分布总体。如果因变量的分布明显的是非正态，不能使用该过程，而应该使用非参数分析过程。如果几个因变量之间彼此不独立，应该用Repeated Measure过程。 [例子]

调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量，数据如表1-1所示。

表1-1 不同水稻品种百丛中稻纵卷叶螟幼虫数

图1-2 单因素方差分析窗口

3）设置分析变量

因变量: 选择一个或多个因子变量进入“Dependent List”框中。本例选择“幼虫”。

因素变量: 选择一个因素变量进入“Factor”框中。本例选择“品种”。

4）设置多项式比较

单击“Contrasts”按钮，将打开如图1-3所示的对话框。该对话框用于设置均值的多项式比较。

图1-3 “Contrasts”对话框

定义多项式的步骤为：

均值的多项式比较是包括两个或更多个均值的比较。例如图1-3中显示的是要求计算“1.1×mean1-1×mean2”的值，检验的假设H0：第一组均值的1.1倍与第二组的均值相等。单因素方差分析的“0ne-Way ANOVA”过程允许进行高

达5次的均值多项式比较。多项式的系数需要由读者自己根据研究的需要输入。具体的操作步骤如下：

① 选中“Polynomial”复选项，该操作激活其右面的“Degree”参数框。

② 单击Degree参数框右面的向下箭头展开阶次菜单，可以选择“Linear”线性、“Quadratic”二次、“Cubic”三次、“4th”四次、“5th”五次多项式。 ③ 为多项式指定各组均值的系数。方法是在“Coefficients”框中输入一个系数，单击Add按钮，“Coefficients”框中的系数进入下面的方框中。依次输入各组均值的系数，在方形显示框中形成—列数值。因素变量分为几组，输入几个系数，多出的无意义。如果多项式中只包括第一组与第四组的均值的系数，必须把第二个、第三个系数输入为0值。如果只包括第一组与第二组的均值，则只需要输入前两个系数，第三、四个系数可以不输入。

可以同时建立多个多项式。一个多项式的一组系数输入结束，激话“Next”按钮，单击该按钮后“Coefficients”框中清空，准备接受下一组系数数据。如果认为输入的几组系数中有错误，可以分别单击“Previous”或“Next”按钮前后翻找出错的一组数据。单击出错的系数，该系数显示在编辑框中，可以在此进行修改，修改后单击“Change”按钮在系数显示框中出现正确的系数值。当在系数显示框中选中一个系数时，同时激话“Remove”按钮，单击该按钮将选中的系数清除。

④单击“Previous”或“Next”按钮显示输入的各组系数检查无误后，按“Continue”按钮确认输入的系数并返回到主对话框。要取消刚刚的输入，单击“Cancel”按钮；需要查看系统的帮助信息，单击“Help”按钮。

本例子不做多项式比较的选择,选择缺省值。

5）设置多重比较

在主对话框里单击“Post Hoc”按钮，将打开如图5-4所示的多重比较对话框。该对话框用于设置多重比较和配对比较。方差分析一旦确定各组均值间存在差异显著，多重比较检测可以求出均值相等的组；配对比较可找出和其它组均值有差异的组，并输出显著性水平为0.95的均值比较矩阵，在矩阵中用星号表示有差异的组。

图1-4 “Post Hoc Multiple Comparisons”对话框

(1)多重比较的选择项：

①方差具有齐次性时(Equal Variances Assumed)，该矩形框中有如下方法供选择：

LSD (Least-significant difference) 最小显著差数法，用t检验完成各组均值间的配对比较。对多重比较误差率不进行调整。

Bonferroni (LSDMOD) 用t检验完成各组间均值的配对比较，但通过设置每个检验的误差率来控制整个误差率。

Sidak 计算t统计量进行多重配对比较。可以调整显著性水平，比Bofferroni方法的界限要小。

Scheffe 对所有可能的组合进行同步进入的配对比较。这些选择项可以同时选择若干个。以便比较各种均值比较方法的结果。

R-E-G-WF (Ryan-Einot-Gabriel-Welsch F) 用F检验进行多重比较检验。 R-E-G-WQ (Ryan-Einot-Gabriel-Welsch range test) 正态分布范围进行多重配对比较。

S-N-K (Student-Newmnan-Keuls) 用Student Range分布进行所有各组均值间的配对比较。如果各组样本含量相等或者选择了“Harmonic average of all groups”即用所有各组样本含量的调和平均数进行样本量估计时还用逐步过程进行齐次子集(差异较小的子集)的均值配对比较。在该比较过程中，各组均值从大到小按顺序排列，最先比较最末端的差异。

Tukey (Tukey's，honestly signicant difference) 用Student-Range统计量进行所有组间均值的配对比较，用所有配对比较误差率作为实验误差率。 Tukey's-b 用“stndent Range”分布进行组间均值的配对比较。其精确值为前两种检验相应值的平均值。

Duncan (Duncan's multiple range test) 新复极差法（SSR），指定一系列的“Range”值，逐步进行计算比较得出结论。

Hochberg's GT2 用正态最大系数进行多重比较。

Gabriel 用正态标准系数进行配对比较，在单元数较大时，这种方法较自由。

Waller-Dunca 用t统计量进行多重比较检验,使用贝叶斯逼近。

Dunnett 指定此选择项，进行各组与对照组的均值比较。默认的对照组是最后一组。选择了该项就激活下面的“Control Category”参数框。展开下拉列表，可以重新选择对照组。

“Test”框中列出了三种区间分别为：

“2-sides” 双边检验;

? “Conbo1”“右边检验。 ②方差不具有齐次性时(Equal Varance not assumed)，检验各均数间是否有差异的方祛有四种可供选择：

Tamhane's T2, t检验进行配对比较。

Dunnett's T3，采用基于学生氏最大模的成对比较法。

Games-Howell，Games-Howell比较，该方法较灵活。

Dunnett's C，采用基于学生氏极值的成对比较法。

③ Significance 选择项，各种检验的显著性概率临界值，默认值为0.05，可由用户重新设定。

本例选择“LSD”和“Duncan”比较，检验的显著性概率临界值0.05。

6) 设置输出统计量

单击“Options”按钮，打开“Options”对话框，如图1-5所示。选择要求输出的统计量。并按要求的方式显示这些统计量。在该对话框中还可以选择对缺失值的处理要求。各组选择项的含义如下：

图1-5输出统计量的设置

“Statistics”栏中选择输出统计量:

Descriptive，要求输出描述统计量。选择此项输出观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变量的95％置信区间。 Fixed and random effects, 固定和随机描述统计量

Homogeneity-of-variance，要求进行方差齐次性检验，并输出检验结果。用“Levene lest ”检验，即计算每个观测量与其组均值之差，然后对这些差值进行一维方差分析。

Brown-Forsythe 布朗检验

Welch,韦尔奇检验

Means plot，即均数分布图，根据各组均数描绘出因变量的分布情况。 “Missing Values”栏中，选择缺失值处理方法。

Exclude cases analysis by analysis选项，被选择参与分析的变量含缺失值的观测量，从分析中剔除。

Exclude cases listwise选项，对含有缺失值的观测量，从所有分析中剔除。

以上选择项选择完成后，按“Continue”按钮确认选择并返回上一级对话框；单击“Cancel”按钮作废本次选择；单击“Help”按钮，显示有关的帮助信息。本例子选择要求输出描述统计量和进行方差齐次性检验，缺失值处理方法选系统缺省设置。

6）提交执行

设置完成后，在单因素方差分析窗口框中点击“OK”按钮，SPSS就会根据设置进行运算，并将结算结果输出到SPSS结果输出窗口中。

7) 结果与分析

输出结果：

表5-2描述统计量，给出了水稻品种分组的样本含量N、平均数Mean、标准差Std.Deviation、标准误Std.Error、95%的置信区间、最小值和最大值。

表5-3为方差齐次性检验结果，从显著性慨率看，p>0.05，说明各组的方差在a=0.05水平上没有显著性差异，即方差具有齐次性。这个结论在选择多重比较方法时作为一个条件。

表5-4方差分析表：第1栏是方差来源，包括组间变差“Between Groups”；组内变差“Within Groups”和总变差“Total”。第2栏是离差平方和“Sum of Squares”，组间离差平方和87.600，组内离差平方和为24.000，总离差平方和为111.600，是组间离差平方和与组内离差平方和相加之和。第3栏是自由度df，组间自由度为4，组内自由度为10；总自由度为14。第4栏是均方“Mean Square”，是第2栏与第3栏之比；组间均方为21.900，组内均方为2.400。第5栏是F值9.125（组间均方与组内均方之比）。第6栏：F 值对应的概率值，针对假设H0：组间均值无显著性差异(即5种品种虫数的平均值无显著性差异)。

计算的F值9.125，对应的概率值为0.002。

表5-5 LSD法进行多重比较表，从表5-4结论已知该例子的方差具有其次性，因此LSD方法适用。第1栏的第1列“[i]品种”为比较基准品种，第2列“[j] 品种”是比较品种。第2栏是比较基准品种平均数减去比较品种平均数的差值（Mean Difference），均值之间具有0.05水平（可图5-4对话框里设置）上有显著性差异，在平均数差值上用“*”号表明。第3栏是差值的标准误。第 4栏是

差值检验的显著性水平。第5栏是差值的95%置信范围的下限和上限。

表5-6 是多重比较的Duncan法进行比较的结果。第1栏为品种，按均数由小到大排列。第2栏列出计算均数用的样本数。第3栏列出了在显著水平0.05上的比较结果，表的最后一行是均数方差齐次性检验慨率水平，p>0.05说明各组方差具有齐次性。

多重比较比较表显著性差异差异的判读：在同一列的平均数表示没有显著性差异，反之则具有显著性的差异。例如，品种3横向看，平均数显示在第3列“2”小列，与它同列显示的有品种2的平均数，说明与品种2差异不显著（0.05水平），再往右看，平均数显示在第3列“3”小列，与它同列显示的有品种4的平均数，说明与品种4差异不显著（0.05水平）。则品种3与品种5和品种1具有显著性的差异（0.05水平）。

品种3和品种4都显示有平均数值。

结果分析:

根据方差分析表输出的p值为0.002可以看出，无论临界值取0.05，还是取0.01，p值均小于临界值。因此否定Ho假设，水稻品种对稻纵卷叶螟幼虫抗虫性有显著性意义，结论是稻纵卷叶螟幼虫数量的在不同品种间有明显的不同。根据该结论选择抗稻纵卷叶螟幼虫水稻品种，犯错误的概率几乎为0.008。只有在方差分析中F检验存在差异显著性时，才有比较的统计意义。

LSD法多重比较表明：

品种1与品种2、品种3和品种5之间存在显著性差异；

品种2与品种1和品种4之间存在显著性差异；

品种3与品种1和品种5之间存在显著性差异；

品种4与品种2和品种5之间存在显著性差异；

品种5与品种1、品种3和品种4之间存在显著性差异。

Duncan法多重比较表明：

品种5与品种3、品种4和品种1之间存在显著性差异。品种2与品种4和品种1之间存在显著性差异；品种3与品种5和品种1之间存在显著性差异；

品种4与品种5和品种2之间存在显著性差异；

品种1与品种5、品种2和品种3之间存在显著性差异；

两种方法比较结果一致。

推荐学习书籍
《CDA一级教材》适合CDA一级考生备考，也适合业务及数据分析岗位的从业者提升自我。完整电子版已上线CDA网校，累计已有10万+在读~

免费加入阅读：https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

方差多重比较方差分析缺失值缺失值处理正态分布标准差数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇SPSS分析技术：Pearson相关、Spearman相关及Kendall相关

下一篇SAS中最最最实用的5个字符串处理函数

用SPSS进行单因素方差分析和多重比较

CDA考试动态

CDA报考指南

热门栏目

最新资讯

【CDA干货】互联网运营必看：私域用户质量数据分析 ...

【CDA持证人案例分享】用 Excel 精准监控电商及推广 ...

【CDA持证人干货分享】13年国企财务：如何借助DeepS ...

【CDA持证人案例分享】Excel动态报表设计：基于业务 ...

【CDA干货】字节大佬：如何通过动态分级快速提升转 ...

Windows 系统和 MacOS 系统下的 Anaconda 安装教程 ...

数据运营的工作内容、技能要求及发展前景 ...

【干货】字节大佬：教培行业销售运营全景作战地图【 ...

四大一线城市约50%人口租房，数据分析能挖出哪些 “ ...

Python 实战案例 —RFM 客户价值分析模型 ...

【案例】奥利奥坚果新品与蒙牛“数字牧场”的成功经 ...

美关税政策下的全球金融市场动荡：深度数据分析与洞 ...

【重磅】苹果捐赠3000万给浙大这专业，透露未来就业 ...

非专业，怎么才能证明自己的数据分析能力？ ...

保姆级教程！一文读懂数据分析师的职业发展路径 ...

【干货】用DeepSeek三步骤搞定Excel数据清洗，效率 ...

被统计公式劝退？这门极简课程让你14天学会用Python ...

【干货】如何用RFM模型精准识别高价值客户？ ...

CDA数据分析师就业班3月29日开班，仅剩1个名额 ...

【案例】网飞Netflix流量漏斗分析案例 ...