热线电话:13121318867

登录
2020-08-30 阅读量: 1111
如何解决线性模型变量相关性问题的讨论

首先要明确一点:变量之间的相关性(只要不是完全相关)是不会影响参数的一致性的。

那么会影响什么呢?影响的是参数估计的方差。

所以,如果你的样本足够大,变量间的相关性不是什么大问题,甚至压根就不是问题。

那么如果你的样本没那么大,该怎么处理呢?这个时候就要看你做模型的目的了。

简单的区分的话,你究竟关注相关,还是因果,甚至只是想预测?


如果你是关注因果,那么不好意思,这个问题没有办法。比如如果在经济学里面,你如果删掉任何一个变量,都会导致遗漏变量而产生偏误,这个时候你的系数估计是不一致的。

如果仅仅是关注相关,那么主成分分析等是个好的方法。此外如果你觉着有一些系数应该为0,甚至还可以LASSO。

如果你是想预测,那么虽然多重共线性导致系数估计方差变大,但是预测能力不会有所降低,所以这个问题没有那么值得去处理。


参考:https://www.zhihu.com/question/27974196

41.4359
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子