2020-08-30
阅读量:
1111
如何解决线性模型变量相关性问题的讨论
首先要明确一点:变量之间的相关性(只要不是完全相关)是不会影响参数的一致性的。
那么会影响什么呢?影响的是参数估计的方差。
所以,如果你的样本足够大,变量间的相关性不是什么大问题,甚至压根就不是问题。
那么如果你的样本没那么大,该怎么处理呢?这个时候就要看你做模型的目的了。
简单的区分的话,你究竟关注相关,还是因果,甚至只是想预测?
如果你是关注因果,那么不好意思,这个问题没有办法。比如如果在经济学里面,你如果删掉任何一个变量,都会导致遗漏变量而产生偏误,这个时候你的系数估计是不一致的。
如果仅仅是关注相关,那么主成分分析等是个好的方法。此外如果你觉着有一些系数应该为0,甚至还可以LASSO。
如果你是想预测,那么虽然多重共线性导致系数估计方差变大,但是预测能力不会有所降低,所以这个问题没有那么值得去处理。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论