SPSS统计分析：距离分析-CDA数据分析师官网

热线电话：13121318867

SPSS统计分析：距离分析

2017-09-30

SPSS统计分析：距离分析

在偏相关分析中，关心的是某两个变量的相关性，因此需要控制其他认为“次要”变量的影响。实际上，事情往往比这更复杂，有时变量躲到无法一一关心的地步，它们都携带了一定的信息，但彼此又有重叠，此时最直接的办法就是将所有变量按照一定的标准进行分类，即聚类分析。但聚类分析是一种比较复杂的多元统计方法，指标太多时计算起来会比较繁琐和费时，如果能事先给点提示，就是使其更加简便和易用。本文介绍的距离分析就是一种简化数据的一种预分析过程，通过它可以得到初步的分析线索。

距离分析的基本概念

距离是对观察变量之间的相似或者不相似程度的一种测度，它计算的是1对变量之间或1对观测变量之间的广义距离。这些相似性或距离测度可以应用于其他分析过程，例如因子分析、聚类分析或多维尺度分析等，这样做有助于对复杂数据集的深入分析。

SPSS分析案例

用于衡量经济发展水平的指标很多，于是在做深入分析之前，有必要事先了解下这些指标之间的相似性，本节就用距离分析对这个问题加以研究。数据文件如下：

参数设置：

依次单击“分析——相关——距离···”，打开举例分析的主界面，如下图所示，在左侧变量列表选中除地区以外的所有变量，将其作为分析变量选入“变量”列表，分别单击选中“变量间”单选框和“相似性”单选框。

单击“度量”按钮，弹出如下界面。单击“转化值”栏的下拉列表，选中“Z得分”选项；单击“继续”按钮返回主界面。

结果分析：

从近似矩阵表给出的各变量之间的相似矩阵来看，图中标红色的较大相关系数的几对变量，包含第三产业增加值和GDP总值之间，第三产业从业人员比重分别和社会综合生产率、人均GDP之间、社会综合生产率分别和人均GDP、人均税收之间，人均GDP和人均税收之间，农村居民人均收入分别和社会综合生产率、人均GDP、人均税收这3个变量之间。它们在进一步分析中应该予以重点关注，或者直接对其进行适当的预处理。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；