SPSS-数据处理-数据变量-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读SPSS-数据处理-数据变量

SPSS-数据处理-数据变量

2017-10-23

SPSS-数据处理-数据变量

spss工具中”行“用【个案】表示，“列”用【变量】表示。变量其实也就是我们在数据库中称之为字段的概念。但是在统计学中，我们称之为变量。

接下来主要介绍两点有关变量的基础知识：一、变量的数据类型二、变量的尺度

一、变量的数据类型

从所周知，变量分为不同的数据类型，分别是：a：数值型数据、b：字符型数据、c：日期型数据。

a:数值型数据：直接使用自然数或度量单位进行计量的数值数据。例如：收入、年龄、体重、身高这几个变量均为数值型数据。可以直接用算术运算方法进行汇总和分析，这是区分是否是数值型数据的重要特征。

b:字符型数据：也成为文本数据，由字符串组成，它是不能进行算术运算的文字数据类型。它包括中文字符、英文字符、数字字符（非数值型）等字符。例如姓名、性别、省份这几个变量均为字符型数据。字符型数据是一种分类数据，例如性别可以分为男、女两类。省份可以分为好多省，我们可以通过对这些分类数据进行分类研究，从而更全面的掌握事务特征。

c:日期型数据：用于表示日期或时间数据，它可以进行算术运算，所以它是一种特殊的数值型数据。主要应用在时间序列分析中。

二、变量的尺度

上面介绍的数据类型主要是数据库中的语言，有的时候仅用数据类型不能准确的说明变量的含义和属性。为了更好的说明变量的含义和属性，在统计学中就采用了变量尺度这个概念。举例：

职业变量，1代表白领、2代表蓝领、3代表金领，这时1、2、3只是个标记，属于并列关系，没有次序关系。

职级变量，1代表初级、2代表中级、3代表高级，这时1、2、3不只是个标记，还有次序关系。

年龄变量，1代表1岁、 2代表2岁、 3代表3岁，这时1、2、3不只是个标记，还有次序、大小关系，可以做算术运算。

职业职级年龄三个变量的数据类型都是数值型，但数值的集体含义不同，适用的统计方法也不同，这时就必须给数据变量增加一个测量尺度属性。

尺度属性从低到高分为四个层级：a：定类尺度、b：定序尺度、c：定距尺度、d：定比尺度。

a：定类尺度：是对事物类别和属性的一种测度。特点：其值只能代表事物的类别和属性，不能比较各类别之间的大小，例如性别、职业这两个变量。spss中用【名义（N）】表示。

b：定序尺度：是对事物之间等级或者顺序的一种测度。特点：其计算结果只能排序，不能进行算术运算，例如学历、职级这两个变量。spss中用【序号（O）】表示。

c：定距尺度：是对事物次序之间间距的一种测度，只可以进行加减运算、不能进行乘除运算，不仅能对事物进行排序，还能准确计算次序之间的差距是多少，例如温度、时间这两个变量。spss中用【度量（S）】表示。

d：定比尺度：是测量两个测量值之间比值的一种测度。它能够进行加减乘除运算，例如收入、用户数这两个变量。它与定距尺度最大的区别在于它有一个固定的绝对“0”值，而定距尺度没有。在定距尺度中“0”不表示没有，它只是一个测量值；而在定比变量中“0”就表示没有。spss中用【度量（S）】表示。