用SPSS做数据分析？先弄懂SPSS的基础知识吧-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读用SPSS做数据分析？先弄懂SPSS的基础知识吧

用SPSS做数据分析？先弄懂SPSS的基础知识吧

2014-11-25

用SPSS做数据分析？先弄懂SPSS的基础知识吧

1、SPSS数据分析的流程

2、SPSS特性：

易用性强

操作界面极为友好，操作简单

良好的帮助系统和自学功能

为高级用户提高编程功能

功能强大

成熟的统计过程

完美的图形处理功能

提供多种数据准备技术

兼容性好

数据输入：Excel,Lotus,Oracle,SQL Server,Acess,dBASE,文本

数据输出：Word,HTML,XML,Excel，Powerpoint,PDF.

3、数据的编辑

常量

数值型常量：除了普通写法外还可以用科学计数法，如：1.3E18；

字符型常量：用单引号或双引号括起来如果字符中包含单引号，则必须使用双引号；

日期常量：日期个数的数据，一般需要使用日期函数进行转换；

变量

变量名长度不能超过8；

三种基本的类型：数值、字符和日期；

可以在variable view界面设定变量的长度及小数位、变量的描述、变量值的描述、missing值、显示宽度、对齐方式和变量的测度方式；

变量的测试方式

Scale：定距变量，如：身高、体重等；

Ordinal：定序变量，如：教育程度、级别等；

Nominal：定类变量，如：性别、民族等；

操作符与表达式

三种基本的运算：数学、关系和逻辑

数学运算符：+ – * / ** ()

关系运算符：> >= < <= = ~=

逻辑运算符：&(AND) |(OR) ~(NOT)

三种运算对应三种表达式

常用的数据操作命令

Data->Sort Cases

Transform->Rank Cases

Transform->Count

Transform->Recode

Transform->Automatic Recode

Transform->Compute

Data->Transpose

Data->Split Files

Data->Merge Files

Compute

数值型：compute num1=value.

字符型：String A(a11).compute a=’hello world’.

日期型：compute data1=date.mdy(month,day, year).

Rocode

recode variable name(old value=new value).

recode variable name(old value=new value) into new variable name.

字符型变量使用auto recode

Split file

有的时候需要对变量做些分组的分析，但一些分析方法并不提供分组变量的设置选项这就需要用到Split file命令；

例如使用 Descriptives 做描述性分析，如果想分年龄做分析，这样就可以用年龄变量做为分组变量；

可以看到这里的Split其实是分组，而不是拆分文件；

analyze all case分析所有的样本，不产生分组；

compare groups产生对比分析组；

output by groups分组输入分析结果；

Merge File

add cases 合并变量相同，但是case不同的文件；

add variables合并变量不同，case相同的文件这里的变量不同可以是部分的变量不同，case相同也可以是一个文件的case是另外一个文件的子集；

数据的分类汇总

使用Aggregate命令

指定分类变量对观测量进行分组，对每组观测量的各变量求描述统计量；

检查重复的数据

使用identify duplicate cases

数据的加权

使用weight case

选取一定的case进行分析

使用select cases：在对数据的子集进行分析的时候需要用到这个命令；

常用的数学函

取绝对值：abs（数字型表达式）

求余数函数：mod（数字型表达式，模数），模数不能为0该函数在需要对某一变量求模数的余数时使用，如果对一个顺序编号或自然数序列求模数的余数，可将该序列按模数等距分类，从而实行等距抽样；

四舍五入函数：rnd（数字型表达式）

开方函数：sqrt（数字型表达式）

四、基本的统计分析

SPSS统计分析概述：

针对不同类型的数据选取不同的分析方法，正确的分析方法是得到正确结果的关键；

spss提供数字分析和图形分析两种分析形式；

高级分析之前一般都需要做描述性统计分析，把握数据的规律对分析解释数据有很好的引导和帮助作用；

Descriptive Statistics

– Frequencies：频数分析

– Descriptives：描述统计

– Explore：探索分析

– Crosstabs：列联表分析

– Ratio:比率分析

Descriptives

– 可以对变量进行标准化；

Explore

– Explore是对连续性变量进行探索性分析最有效的工具；

– 考察数据的奇异性和分布特征；

– 箱盒图、茎叶图、正态检验图及方差齐次性检验；

Crosstabs

– 数据类型要求为分类变量；

– 二维或多维交叉频数表（列联表），分析事物（变量）之间的相互影响和关系；

– 可以做卡方检验，来分析行列变量之间是否存在相关性；

分类变量统计描述常用指标

– 统计量：

• 频数、频率、累计频数、累计频率、众数

• 比：任意两个变量之比

性别比，货物/销售人员比

构成比：部分占总体的比例

• 率：事件的发生强度

– 图形：

• 条图、饼图

Spss操作

– 单个变量的分析

• Analyze…Descriptive Statistics…Frequcencies

– 多个变量的分析

• Analyze…Descriptive Statistics…Crosstabs

– 条图

• Graph…(interactive…)bar

– 饼图

• Graph…(interactive…)pie

连续变量的描述指标

– 频数表Frequency

• 直观的方法：分布类型分布特征

– 集中趋势Central tendency

• 均数mean 中位数median 众数mode

– 离散趋势Dispersion tendency

• 全距Range

• 方差Variance 标准差std.deviation

如何计算各个描述统计量

– Analyze->Descriptive Statistics->Frequcencies…

– Analyze->Descriptive Statistics->Descriptives…

– Analyze->compare means->means…

• 如何用图形描述连续变量

– Graph…Interactive…Histogram

• 如何应用Explore对连续变量进行探索性分析

– Analyze->Descriptive Statistics->Explore…

Basic Tables过程：对分类/定量资料进行各种复杂格式的描述；

• General Tables过程：在同一张表格内同时对分类资料、连续资料和多选题数据进行汇总功能非常强大，但使用上相对复杂；CDA 数据分析师培训

• Custom Tables过程：含有表格预览窗口，并可在制表过程中控制结果；

• Multiple Response Sets/Tables过程：专门为多选题数据设计的制表过程；

• Tables of Frequencies过程：在同一张表格中对多个分类变量同时输出频数表；

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

统计分析数据分析特征 SQL

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇随机森林 vs XGBoost vs 决策树：算法选择中的

下一篇图论在大数据分析中的作用！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

用SPSS做数据分析？先弄懂SPSS的基础知识吧

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】机器学习算法工程实用案例解析：从落地 ...

【CDA干货】卷积神经网络与无迹卡尔曼滤波融合：原 ...

CDA数据分析师：数据清洗实操指南，筑牢数据分析的 ...

【CDA干货】决策树模型变量重要性排序：原理、方法 ...

【CDA干货】Excel卡方检验实操全指南：从原理到落地 ...

CDA数据分析师：数据整合实操指南，打破数据孤岛， ...

【CDA干货】数据分析全流程常见问题：成因、危害与 ...

【CDA干货】维度表与事实表：数据仓库的核心双子星 ...

CDA数据分析师：数据读取实操指南，打通数据价值转 ...

【CDA干货】用户行为分析中泛化性指标：计算方法、 ...

【CDA干货】以数为鉴，读懂用户：三大行业用户行为 ...

CDA数据分析师：量化策略分析框架，解锁数据驱动决 ...

【CDA干货】随机森林模型训练全解析：从参数调优到 ...

【CDA干货】随机森林算法重要性分析：原理、实操与 ...

CDA数据分析师：数据思维赋能企业管理，激活决策新 ...

【CDA干货】数据分析赋能价值创造：国内外知名经典 ...

【CDA干货】Python爬取163网易财经上市公司财务报表 ...

CDA数据分析师：数字化时代，数据思维的核心步骤与 ...

【CDA干货】线性回归拟合性判断实战指南：从指标解 ...

【CDA干货】安装SQL Server后提示“服务名无效”： ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载