SPSS中异常值检验的几种方法介绍(3)_数据分析师-CDA数据分析师官网

SPSS中异常值检验的几种方法介绍(3)_数据分析师

2015-01-03

最后我们看一眼统计检验指标结果：

大家可以把我们前面做的结果进行相互比较，或许你能够看出哪些指标更好，哪些指标该如何评测了！

我看出来了，比如：Sig 值越大越好，平稳得 R 方也是越大越好吧！

Sig.列给出了 Ljung-Box 统计量的显著性值，该检验是对模型中残差错误的随机检验；表示指定的模型是否正确。显著性值小于 0.05 表示残差误差不是随机的，则意味着所观测的序列中存在模型无法解释的结构。

平稳的 R 方：显示固定的 R 平方值。此统计量是序列中由模型解释的总变异所占比例的估计值。该值越高（最大值为 1.0），则模型拟合会越好。

检查模型残差的自相关函数 (ACF) 和偏自相关函数 (PACF) 的值比只查看拟合优度统计量能更多地从量化角度来了解模型。合理指定的时间模型将捕获所有非随机的变异，其中包括季节性、趋势、循环周期以及其他重要的因素。如果是这种情况，则任何误差都不会随着时间的推移与其自身相关联（自关联）。这两个自相关函数中的显著结构都可以表明基础模型不完整。

如果你一定要理解 RMSE 或者 MAE 等统计检验量，只好找来教科书好好学习了！我想，等我要写教科书的时候，一定会告诉大家如何检验这些统计量，并给出各种计算公式！但我的学生或读者大部分是文科或企业经营分析人员，讲这些东西他们都会跑了！

大家不要忘了，SPSS 时间序列预测模块还包含模型应用，也就是可以把预测模型转存为 XML 模型文件，以后预测的时候就可以不用原始数据了！

我记得早期 SPSS 公司推出时间序列预测模型软件 DecisionTime & What-if，非常好用，而且还可以进行更为细致的分析，甚至结果输出都是自动报告！

当然，我找机会用 PASW Modeler 13 操作一次上述时间序列预测建模过程，也就是数据挖掘工具中的时间序列预测方法，会更方便、更简单、更好部署！

备注：PASW Modeler 13 就是 SPSS 公司的 Clementine 13.0 版本！博易智讯的马博士说： SPSS 公司已经把 SPSS 软件改名叫 PASW Statistics， Clementine 叫 PASW Modeler。

自变量的选择问题，在预测未来半年的销售收入中，ARIMA 模型可以把其它预测变量纳入考虑，但如何确定未来这些预测变量的值呢？

主要方法可以考虑：1）选择最末期数据；2）选择近三期数据的平均；3）选择近三期的移动平均这里我们选近三期移动平均作为预测自变量数值。请问沈浩老师，以上这一段话怎么操作啊？在哪里选择这 3 种方法来确定未来的自变量的值啊？我试过手工输入未来的自变量值，可以做出预测，但是我想模型应该可以自动生成这些未来自变量的值，我找了很久都没有找着，请赐教！非常感谢！另外，有一个问题我一直没有想得很明白，想请教一下。多元回归分析做的预测和时间序列分析做的预测，使用条件和最大的区别是什么啊？如果数据是按时间走的，是不是就不适合用多元回归分析做预测呢？如果您能回复，我将感到万分荣幸。 SPSS 软件里面自变量取值一般是 0-1；真实的干扰需要采用 Clementine 软件就有这个自动添加方式了，抱歉我没有说清楚！ 2）时间序列数据，自变量是相关的，当然不适合简单的线性回归分析！

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

线性回归数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

SPSS中异常值检验的几种方法介绍(3)_数据分析师

CDA考试动态

CDA报考指南

热门栏目

最新资讯

保姆级教程！一文读懂数据分析师的职业发展路径 ...

【干货】用DeepSeek三步骤搞定Excel数据清洗，效率 ...

被统计公式劝退？这门极简课程让你14天学会用Python ...

【干货】如何用RFM模型精准识别高价值客户？ ...

CDA数据分析师就业班3月29日开班，仅剩1个名额 ...

【案例】网飞Netflix流量漏斗分析案例 ...

tensorflow_datasets 如何load本地的数据集？ ...

《CDA二级教材》试读版上线CDA网校，助你轻松拿下二 ...

【干货】3步带你画出用户DNA，精准营销更进一步 ...

什么是随机森林，它的优缺点是什么？：面试标准答案 ...

【干货】电商营收暴跌40%，如何排查？ ...

【干货】如何通过精细化运营提升 DAU 指标？ ...

【干货】AB test 在业务中的落地应用

自上而下的指标体系构建全攻略

解锁数据分析师高薪密码，CDA 脱产就业班助你逆袭！ ...

如何在mysql语句中查询一个表,但不包含某字段? ...

深度解析用户画像：数据运营的核心力量 ...

2025年AI智能体元年，数据分析师会被替代吗？ ...

【案例】业务数据分析方法之多维度拆解 ...

【干货】我手里有好几个产品，该怎么分配资源？-波 ...