用SPSS进行单因素方差分析和多重比较
单因素方差分析
单因素方差分析 也称作一维方差分析。它检验由单一因素影响的一个(或几个相互独立的)因变量由因素各水平分组的均值之间的差异是否具有统计意义。还可以对该因素的若干水 平分组中哪一组与其他各组均值间具有显著性差异进行分析,即进行均值的多重比较。One-Way ANOVA过程要求因变量属于正态分布总体。如果因变量的分布明显的是非正态,不能使用该过程,而应该使用非参数分析过程。如果几个因变量之间彼此不独立,应该用Repeated Measure过程。 [例子]
调查不同水稻品种百丛中稻纵卷叶螟幼虫的数量,数据如表1-1所示。
表1-1 不同水稻品种百丛中稻纵卷叶螟幼虫数
图1-2 单因素方差分析窗口
3)设置分析变量
因变量: 选择一个或多个因子变量进入“Dependent List”框中。本例选择“幼虫”。
因素变量: 选择一个因素变量进入“Factor”框中。本例选择“品种”。
4)设置多项式比较
单击“Contrasts”按钮,将打开如图1-3所示的对话框。该对话框用于设置均值的多项式比较。
图1-3 “Contrasts”对话框
定义多项式的步骤为:
均值的多项式比较是包括两个或更多个均值的比较。例如图1-3中显示的是要求计算“1.1×mean1-1×mean2”的值,检验的假设H0:第一组均 值的1.1倍与第二组的均值相等。单因素方差分析的“0ne-Way ANOVA”过程允许进行高
达5次的均值多项式比较。多项式的系数需要由读者自己根据研究的需要输入。具体的操作步骤如下:
① 选中“Polynomial”复选项,该操作激活其右面的“Degree”参数框。
② 单击Degree参数框右面的向下箭头展开阶次菜单,可以选择“Linear”线性、“Quadratic”二次、“Cubic”三次、“4th”四次、“5th”五次多项式。 ③ 为多项式指定各组均值的系数。方法是在“Coefficients”框中输入一个系数,单击Add按钮,“Coefficients”框中的系数进入下面 的方框中。依次输入各组均值的系数,在方形显示框中形成—列数值。因素变量分为几组,输入几个系数,多出的无意义。如果多项式中只包括第一组与第四组的均 值的系数,必须把第二个、第三个系数输入为0值。如果只包括第一组与第二组的均值,则只需要输入前两个系数,第三、四个系数可以不输入。
可以同时建立多个多项式。一个多项式的一组系数输入结束,激话“Next”按钮,单击该按钮后“Coefficients”框中清空,准备接受下一组系数数据。 如果认为输入的几组系数中有错误,可以分别单击“Previous”或“Next”按钮前后翻找出错的一组数据。单击出错的系数,该系数显示在编辑框中, 可以在此进行修改,修改后单击“Change”按钮在系数显示框中出现正确的系数值。当在系数显示框中选中一个系数时,同时激话“Remove”按钮,单 击该按钮将选中的系数清除。
④单击“Previous”或“Next”按钮显示输入的各组系数检查无误后,按“Continue”按钮确认输入的系数并返回到主对话框。要取消刚刚的输入,单击“Cancel”按钮;需要查看系统的帮助信息,单击“Help”按钮。
本例子不做多项式比较的选择,选择缺省值。
5)设置多重比较
在主对话框里单击“Post Hoc”按钮,将打开如图5-4所示的多重比较对话框。该对话框用于设置多重比较和配对比较。方差分析一旦确定各组均值间存在差异显著,多重比较检测可以 求出均值相等的组;配对比较可找出和其它组均值有差异的组,并输出显著性水平为0.95的均值比较矩阵,在矩阵中用星号表示有差异的组。
图1-4 “Post Hoc Multiple Comparisons”对话框
(1)多重比较的选择项:
①方差具有齐次性时(Equal Variances Assumed),该矩形框中有如下方法供选择:
LSD (Least-significant difference) 最小显著差数法,用t检验完成各组均值间的配对比较。对多重比较误差率不进行调整。
Bonferroni (LSDMOD) 用t检验完成各组间均值的配对比较,但通过设置每个检验的误差率来控制整个误差率。
Sidak 计算t统计量进行多重配对比较。可以调整显著性水平,比Bofferroni方法的界限要小。
Scheffe 对所有可能的组合进行同步进入的配对比较。这些选择项可以同时选择若干个。以便比较各种均值比较方法的结果。
R-E-G-WF (Ryan-Einot-Gabriel-Welsch F) 用F检验进行多重比较检验。 R-E-G-WQ (Ryan-Einot-Gabriel-Welsch range test) 正态分布范围进行多重配对比较。
S-N-K (Student-Newmnan-Keuls) 用Student Range分布进行所有各组均值间的配对比较。如果各组样本含量相等或者选择了“Harmonic average of all groups”即用所有各组样本含量的调和平均数进行样本量估计时还用逐步过程进行齐次子集(差异较小的子集)的均值配对比较。在该比较过程中,各组均值从大到小按顺序排列,最先比较最末端的差异。
Tukey (Tukey's,honestly signicant difference) 用Student-Range统计量进行所有组间均值的配对比较,用所有配对比较误差率作为实验误差率。 Tukey's-b 用“stndent Range”分布进行组间均值的配对比较。其精确值为前两种检验相应值的平均值。
Duncan (Duncan's multiple range test) 新复极差法(SSR),指定一系列的“Range”值,逐步进行计算比较得出结论。
Hochberg's GT2 用正态最大系数进行多重比较。
Gabriel 用正态标准系数进行配对比较,在单元数较大时,这种方法较自由。
Waller-Dunca 用t统计量进行多重比较检验,使用贝叶斯逼近。
Dunnett 指定此选择项,进行各组与对照组的均值比较。默认的对照组是最后一组。选择了该项就激活下面的“Control Category”参数框。展开下拉列表,可以重新选择对照组。
“Test”框中列出了三种区间分别为:
?
“2-sides” 双边检验;
?
? “<Control” 左边检验 “>Conbo1”“右边检验。 ②方差不具有齐次性时(Equal Varance not assumed),检验各均数间是否有差异的方祛有四种可供选择:
Tamhane's T2, t检验进行配对比较。
Dunnett's T3,采用基于学生氏最大模的成对比较法。
Games-Howell,Games-Howell比较,该方法较灵活。
Dunnett's C,采用基于学生氏极值的成对比较法。
③ Significance 选择项,各种检验的显著性概率临界值,默认值为0.05,可由用户重新设定。
本例选择“LSD”和“Duncan”比较,检验的显著性概率临界值0.05。
6) 设置输出统计量
单击“Options”按钮,打开“Options”对话框,如图1-5所示。选择要求输出的统计量。并按要求的方式显示这些统计量。在该对话框中还可以选择对缺失值的处理要求。各组选择项的含义如下:
图1-5输出统计量的设置
“Statistics”栏中选择输出统计量:
Descriptive,要求输出描述统计量。选择此项输出观测量数目、均值、标准差、标准误、最小值、最大值、各组中每个因变量的95%置信区间。 Fixed and random effects, 固定和随机描述统计量
Homogeneity-of-variance,要求进行方差齐次性检验,并输出检验结果。用“Levene lest ”检验,即计算每个观测量与其组均值之差,然后对这些差值进行一维方差分析。
Brown-Forsythe 布朗检验
Welch,韦尔奇检验
Means plot,即均数分布图,根据各组均数描绘出因变量的分布情况。 “Missing Values”栏中,选择缺失值处理方法。
Exclude cases analysis by analysis选项,被选择参与分析的变量含缺失值的观测量,从分析中剔除。
Exclude cases listwise选项,对含有缺失值的观测量,从所有分析中剔除。
以上选择项选择完成后,按“Continue”按钮确认选择并返回上一级对话框;单击“Cancel”按钮作废本次选择;单击“Help”按钮,显示有关的帮助信息。 本例子选择要求输出描述统计量和进行方差齐次性检验,缺失值处理方法选系统缺省设置。
6)提交执行
设置完成后,在单因素方差分析窗口框中点击“OK”按钮,SPSS就会根据设置进行运算,并将结算结果输出到SPSS结果输出窗口中。
7) 结果与分析
输出结果:
表5-2描述统计量,给出了水稻品种分组的样本含量N、平均数Mean、标准差Std.Deviation、标准误Std.Error、95%的置信区间、最小值和最大值。
表5-3为方差齐次性检验结果,从显著性慨率看,p>0.05,说明各组的方差在a=0.05水平上没有显著性差异,即方差具有齐次性。这个结论在选择多重比较方法时作为一个条件。
表5-4方差分析表:第1栏是方差来源,包括组间变差“Between Groups”;组内变差“Within Groups”和总变差“Total”。第2栏是离差平方和“Sum of Squares”,组间离差平方和87.600,组内离差平方和为24.000,总离差平方和为111.600,是组间离差平方和与组内离差平方和相加之 和。第3栏是自由度df,组间自由度为4,组内自由度为10;总自由度为14。第4栏是均方“Mean Square”,是第2栏与第3栏之比;组间均方为21.900,组内均方为2.400。第5栏是F值9.125(组间均方与组内均方之比)。第6栏:F 值对应的概率值,针对假设H0:组间均值无显著性差异(即5种品种虫数的平均值无显著性差异)。
计算的F值9.125,对应的概率值为0.002。
表5-5 LSD法进行多重比较表,从表5-4结论已知该例子的方差具有其次性,因此LSD方法适用。第1栏的第1列“[i]品种”为比较基准品种,第2列“[j] 品种”是比较品种。第2栏是比较基准品种平均数减去比较品种平均数的差值(Mean Difference),均值之间具有0.05水平(可图5-4对话框里设置)上有显著性差异,在平均数差值上用“*”号表明。第3栏是差值的标准误。第 4栏是
差值检验的显著性水平。第5栏是差值的95%置信范围的下限和上限。
表5-6 是多重比较的Duncan法进行比较的结果。第1栏为品种,按均数由小到大排列。第2栏列出计算均数用的样本数。第3栏列出了在显著水平0.05上的比较结果,表的最后一行是均数方差齐次性检验慨率水平,p>0.05说明各组方差具有齐次性。
多重比较比较表显著性差异差异的判读:在 同一列的平均数表示没有显著性差异,反之则具有显著性的差异。例如,品种3横向看,平均数显示在第3列“2”小列,与它同列显示的有品种2的平均数,说明 与品种2差异不显著(0.05水平),再往右看,平均数显示在第3列“3”小列,与它同列显示的有品种4的平均数,说明与品种4差异不显著(0.05水 平)。则品种3与品种5和品种1具有显著性的差异(0.05水平)。
品种3和品种4都显示有平均数值。
结果分析:
根据方差分析表输出的p值为0.002可以看出,无论临界值取0.05,还是取0.01,p值均小于临界值。因此否定Ho假设,水稻品种对稻纵卷叶螟幼虫抗 虫性有显著性意义,结论是稻纵卷叶螟幼虫数量的在不同品种间有明显的不同。根据该结论选择抗稻纵卷叶螟幼虫水稻品种,犯错误的概率几乎为0.008。 只有在方差分析中F检验存在差异显著性时,才有比较的统计意义。
LSD法多重比较表明:
品种1与品种2、品种3和品种5之间存在显著性差异;
品种2与品种1和品种4之间存在显著性差异;
品种3与品种1和品种5之间存在显著性差异;
品种4与品种2和品种5之间存在显著性差异;
品种5与品种1、品种3和品种4之间存在显著性差异。
Duncan法多重比较表明:
品种5与品种3、品种4和品种1之间存在显著性差异。 品种2与品种4和品种1之间存在显著性差异; 品种3与品种5和品种1之间存在显著性差异;
品种4与品种5和品种2之间存在显著性差异;
品种1与品种5、品种2和品种3之间存在显著性差异;
两种方法比较结果一致。
数据分析咨询请扫描二维码
在当今数据驱动的商业环境中,数据分析师扮演着至关重要的角色。他们帮助企业从大量数据中提取有用的洞察,从而推动决策制定和战 ...
2024-11-07在现代商业环境中,商务数据分析师扮演着至关重要的角色。作为联系业务需求与数据洞察之间的桥梁,数据分析师需要具备一系列技能 ...
2024-11-07在现代商业环境中,商务数据分析师扮演着至关重要的角色。作为联系业务需求与数据洞察之间的桥梁,数据分析师需要具备一系列技能 ...
2024-11-07在现代商业环境中,数据挖掘发挥着至关重要的作用。它不仅帮助企业从庞大的数据集中提取有价值的信息,还为企业的决策和业务运营 ...
2024-11-07数据分析可视化是一种通过图形化方式展现数据的技术,它使复杂的数据变得直观易懂,从而帮助我们更好地做出决策。在这个快速发展 ...
2024-11-07数据分析是一项至关重要的技能,尤其在当今数据驱动的世界中。Python以其强大的库和简单的语法成为了数据分析领域的佼佼者。本文 ...
2024-11-07在现代数据驱动的环境中,数据分析师扮演着至关重要的角色。他们需要掌握多种工具,以满足数据分析、处理和可视化的需求。无论是 ...
2024-11-07作为一名业务分析师,你将发现自己处于企业决策和数据驱动战略之间的桥梁位置。这个角色要求掌握一系列技能,以便有效地将数据转 ...
2024-11-07CDA中科院城市环境研究所(厦门)内训圆满成功 2017年9月12日-15日,CDA数据分析师在中科院城市环境研究所(厦门)进行了 ...
2024-11-07数据分析是现代商业和研究领域不可或缺的重要工具。无论是为了提高业务决策的准确性,还是为了发掘隐藏在数据中的潜在价值,了解 ...
2024-11-06数据分析是一个精细且有序的过程,旨在从海量数据中提取有用的信息,为决策提供有力支持。无论你是新手还是有经验的分析师,理解 ...
2024-11-06在当今竞争激烈的商业环境中,业务分析师(Business Analyst, BA)的角色变得愈加重要。随着企业对数据驱动决策的依赖加深,业务 ...
2024-11-06在现代信息技术的广阔世界中,大数据架构师扮演着至关重要的角色。他们不仅引领着企业的数据战略,还通过技术创新推动业务的不断 ...
2024-11-04在当今数字化时代,数据分析师已成为企业关键角色,帮助决策者通过数据驱动的洞察实现业务目标。成为一名成功的数据分析师,需要 ...
2024-11-03在当今数字化的世界中,数据分析已经成为推动商业决策的关键因素。随着公司和组织越来越依赖数据来驱动业务战略,对数据分析专 ...
2024-11-03《Python数据分析极简入门》 第2节 2 Pandas数据类型 Pandas 有两种自己独有的基本数据结构。需要注意的是,它固然有着两种数据 ...
2024-11-01《Python数据分析极简入门》 第2节 1 Pandas简介 说好开始学Python,怎么到了Pandas? 前面说过,既然定义为极简入门,我们只抓 ...
2024-10-31在当今数据驱动的世界中,数据科学与工程专业的重要性愈发凸显。无论是推动技术进步,还是在商业决策中提供精准分析,这一专业都 ...
2024-10-30在当今信息爆炸的时代,数据已成为企业决策和战略制定的核心资源。爬虫工程师因此成为数据获取和挖掘的关键角色。本文将详细介绍 ...
2024-10-30在当今数据驱动的世界中,数据分析是揭示商业洞察和推动决策的核心力量。选择合适的数据分析工具对于数据专业人士而言至关重要。 ...
2024-10-30