一、SPSS数据文件的特点
(1)SPSS数据文件是一种有结构的数据文件,它由数据结构和内容两部分组成,
(2)数据结构是对SPSS中各列变量及其属性的描述,主要记录数据变量的名称、类型、变量宽度、小数位数、变量名标签、变量值标签、缺失值、显示宽度、对齐方式和计量尺度等必要信息,
(3)数据的内容才是那些待分析的具体数据。
(4)相关概念:个案(或记录)、变量、变量值。
个案:数据编辑窗口中的一行称为一个个案Case)或记录(Record),所有个案组成SPSS数据文件的内容。
变量:数据编辑窗口的一列称为一个变量(Variable),每个变量都有一个名字,称为变量名,它是访问和分析SPSS每个变量的唯一标志。 SPSS数据文件的结构就是对每个变量及相关特征的描述。
变量值:单元格中的具体数值。
创建SPSS数据文件的方法
基于上述特点,建立SPSS数据文件时应完成两项任务:
(1)描述数据的结构:在数据编辑器窗口的变量视图界面定义变量的各个属性,如:变量名,类型、变量宽度、小数位数、变量名标签、变量值标签、缺失值、显示宽度、对齐方式和度量尺度等等。
(2)录入编辑数据:在数据编辑器窗口的数据视图界面中录入已定义各变量的变量值,即原始数据。
二、SPSS数据的结构和定义方法
SPSS数据的结构是对SPSS每列变量及其相关属性的描述,主要包括变量名、数据类型、变量宽度、变量名标签、变量值标签、显示宽度、缺失值、对齐方式、计量尺度等信息。
1、变量名:
变量名是变量访问和分析的唯一标志。在定义SPSS数据结构时应首先给出每列变量的变量名。变量的命名规则如下:
1.首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉字作为变量名。
2.SPSS12.0版本以前,变量名的字符个数最好不多于8个;变量名不区分大小写字母。
3. SPSS有默认的变量名,以字母“VAR”开头,后面补足5位数字,如VAR00001,VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL,BY,AND,NOT,OR等。
4.变量名最好与其代表的数据含义相对应,每个变量名必须具有唯一性。
2、变量类型
变量类型是指每个变量取值的类型。
SPSS中有三种基本变量类型:
(1)数值型
(2)字符型(String)
(3)日期型(Date)
(1)数值型
•数值型是SPSS最常用的变量类型,其变量取值通常由阿拉伯数字和其它特殊符号(圆点、逗号、美元符号)等组成。如工资、年龄、产量、考试成绩等需要定义为数值型变量。
•SPSS关于数值型变量提供了五种不同的数据显示方法:
(1)标准型(Numeric)
(2)科学记数法型(Scientific Notation)
(3)逗号型(Comma)
(4)圆点型(Dot)
(5)美元符号型(Dollar)
其中的标准型( Numeric )是SPSS默认的变量类型。
默认的显示宽度为8位,小数位默认为2位。
(2)字符型(String)
•字符型也是SPSS较常用的变量类型,其变量取值由一个字符串(字母、汉字或数字)组成。字符型变量其取值不能够进行算术运算,如职工号码、姓名、地址、性别、职称等变量都可以定义为字符型。
•注意:字符型数据在SPSS命令处理过程中应用一对双引号括起来,但在输入数据时不应输入双引号,否则双引号将会作为字符型数据的一部分。
(3)日期型(Date)
•日期型数据用来表示日期或者时间,如生日、成立日期等变量可以定义为日期型数据。显示格式:dd-mmm-yyyy;mm/dd/yyyy等等,其中
•“dd”是用两位数来表示日期。“ddd”是用三位数来表示从元月一日算起的日数。
•“mm”是用数字表示的月份数。“mmm”是用英文月份单词的前三个字母表示的月份。
•“yy” 是用两位数来表示的年份。“yyyy” 是用四位数来表示的年份。
•“hh”表示小时;“mm”表示分;“ss”表示秒。
敬请期待下回讲解
暂无数据