如何用spss做好回归分析-CDA数据分析师官网

热线电话：13121318867

如何用spss做好回归分析

2015-09-12

如何用spss做好回归分析

心得1：如何做好回归分析。

经过多次实战，以及看了N多视频，上了N多课，看了N多专业的书。我个人总结做回归的步奏如下：

1对数据进行预处理，替换缺失值和处理异常值；

2是将单个自变量分别与因变量做散点图和做回归，判定其趋势，并做好记录（尤其是系数正负号，要特别记录）；

3是自变量和因变量一起做相关系数，看各个变量相关关系强弱，为下一步检验多重共线性做准备；

4是自变量多重共线性诊断。若变量存在多重共线性，可采用主成分回归，即先将存在多重共线性的变量做主成分分析合并为1个变量，然后再将合并成的新变量和其余自变量一起纳入模型做回归；

5是做残差图，看残差图分布是否均匀（一般在+-3个单位之间均匀分布就比较好）；

6是报告相应结果。

心得2：看到论坛上有网友问为什么他（她）老师不建议采用后向步进法处理变量多重共线性。

老师说过他有个同学做过一个研究，即采用后向步进法剔除变量的方式去做回归，得到的结果犯错的几率比较大。张老师也不建议用这个方法处理多重共线性。处理多重共线性比较好的方法是做主成分回归。

心得3：有个朋友问我在报到回归结果时用未标准化的回归系数好，还是用标准化后的回归系数好。

我个人觉得这个问题仁者见仁智者见智，要看想表达什么。具体而言，如果想表达在其它条件不变的情况下，自变量X每变化1个单位，因变量变化多少个单位，这种情况用未标准化回归系数就好；如果想比较各个自变量对因变量影响的相对大小，即判断相对而言，哪个变量对因变量影响更大。这时需要消除量纲的影响，看标准化后的回归系数。

心得4：这是投稿一篇SSCI外审专家提出的意见。

我做的是无序多分类logistic回归模型。因变量分了5类，有一类个数比较多，达到300多，有1-2类个案比较少，只有30左右。专家提到了要做稳健性检验。这个用stata软件编程加一个robust即可解决问题。不知道在SPSS里面怎么做。欢迎知道的朋友一起讨论下。我个人认为这是一个好问题的。不做稳健性检验模型可能受一些极端值的影响，结果不稳定。可能本来显著的变量剔除1-2个样本后就变得不显著了。所以做回归分析稳健性检验也比较重要。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；