SPSS聚类分析：K均值聚类分析-CDA数据分析师官网

SPSS聚类分析：K均值聚类分析

2017-12-13

SPSS聚类分析：K均值聚类分析

一、概念：（分析-分类-K均值聚类）

1、此过程使用可以处理大量个案的算法，根据选定的特征尝试对相对均一的个案组进行标识。不过，该算法要求您指定聚类的个数。如果知道，您可以指定初始聚类中心。您可以选择对个案分类的两种方法之一，要么迭代地更新聚类中心，要么只进行分类。可以保存聚类成员、距离信息和最终聚类中心。还可以选择指定一个变量，使用该变量的值来标记个案输出。您还可以请求分析方差F统计量。

二、聚类中心（分析-分类-K均值聚类）

为获得最佳有效性，可取一个个案样本并选择迭代和分类方法确定聚类中心。选择最终聚类中心另存为。然后恢复整个数据文件并选择仅分类作为方法，并选择读取初始聚类中心来源以使用该样本估计的中心对整个文件分类。您可以写入和读取文件或数据集。可以在同一会话中继续使用数据集，但不会将其另存为文件，除非在会话结束之前明确将其保存为文件。数据集名称必须符合变量命名规则。

三、迭代（分析-分类-K均值聚类-迭代）

注意：只有在您从“K均值聚类分析”对话框中选择了迭代和分类方法的情况下，这些选项才可用。◎最大迭代次数。限制K均值算法中的迭代次数。即使尚未满足收敛准则，达到迭代次数之后迭代也会停止。此数字必须在1到999之间。◎收敛性标准。确定迭代何时停止。它表示初始聚类中心之间的最小距离的比例，因此必须大于0且小于等于1。例如，如果准则等于0.02，则当完整的迭代无法将任何聚类中心移动任意初始聚类中心之间最小距离的2%时，迭代停止。◎使用运行均值。允许您请求在分配了每个个案之后更新聚类中心。如果不选择此选项，则会在分配了所有个案之后计算新的聚类中心。

四、保存（分析-分类-K均值聚类-保存）

1、聚类成员。创建指示每个个案最终聚类成员的新变量。新变量的值范围是从1到聚类数。

2、与聚类中心的距离。创建指示每个个案与其分类中心之间的欧式距离的新变量。

五、选项：（分析-分类-K均值聚类-选项）

统计量。您可以选择以下统计量：初始聚类中心、ANOVA表以及每个个案的聚类信息。◎初始聚类中心.每个聚类的变量均值的第一个估计值。默认情况下，从数据中选择与聚类数相等的分布良好的多个个案。初始聚类中心用于第一轮分类，然后再更新。◎ANOVA表.显示方差分析表，该表包含每个聚类变量的一元F检验。F检验只是描述性的，不应解释生成的概率。如果所有个案均分配到单独一个聚类，则ANOVA表不显示。◎每个个案的聚类信息.显示每个个案的最终聚类分配，以及该个案和用来对个案分类的聚类中心之间的Euclidean距离。还显示最终聚类中心之间的欧氏距离。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想查询CDA考试成绩，点击>>> “CDA成绩” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想获取CDA考试时间/费用/条件/大纲/通过率，点击 >>>“CDA考试官网” 了解CDA考试详情；

方差分析特征

数据分析咨询请扫描二维码

上一篇运营狗痛诉：作为数据白痴，谁能拯救我啊

下一篇【每周一本（赠）书第15波】如虎添翼！数据处理的SPSS和SAS EG实现（第2版）

SPSS聚类分析：K均值聚类分析

CDA考试动态

CDA报考指南

热门栏目

最新资讯

数据分析师教程《Python数据分析极简入门》第2节 7 ...

数据分析需要学哪些东西呢

数据分析师要有什么能力

数据分析师需要学哪些课程

数据分析师教程《Python数据分析极简入门》第2节 6 ...

数据分析师教程《Python数据分析极简入门》第2节 5 ...

数据分析需要学哪些方面

数据分析适合在什么单位工作

数据分析是什么工作内容

数据分析师需要掌握什么技能

数据开发和数据分析区别

数据架构师是干什么的

数据分析师需要具备的能力

数据分析师需要具备的技能有哪些

数据分析师需要具备的技能和能力

数据分析师的发展前景

数据分析师教程《Python数据分析极简入门》第2节 4 ...

数据分析师的工作内容是什么

数据分析师必须掌握的技能有哪些

数据分析入门难吗