2020-08-03
阅读量:
1052
如果不能通过显著性检验,要剔除变量吗
不能随意剔除变量
假设检验的思路是在控制第I类错误的条件下进行的。第I类错误也就是当总体系数本身为0,但是我们却错误的任务其不为0的错误。我们通常设定的显著性水平,1%、5%、10%,都是犯第I类错误的概率。也就是说,我们可以保证我们犯第I类错误的概率在很小的水平,因而一旦显著了,那么我们犯第I类错误的概率不会太大的,我们可以比较自信地认为,系数的确不为0。注意对于一个比较好的检验,只要假设条件都满足,这个犯错误的概率跟样本量没关系的:只要检验是对的,犯第I类错误的概率就是我们设定的显著性水平。
但是,如果我们做出来结果是不显著的,如果犯错误那也是犯第II类错误:如果本身系数不为0,但是我们却没能拒绝原假设的错误。但是,悲观的是,通常犯第II类错误的概率是不知道的,因而第II类错误的概率不仅取决于样本量(样本量越大越不容易犯错),还取决于系数本身的大小:如果系数比较小,犯第II类错误的概率就会很大很大。
所以,如果做出来结果不显著,此时我们并不知道我们犯第II类错误的概率有多大,在极端情况下可能接近于100%,因而如果不显著就断言没有效应,或者系数为0,是非常非常武断的。
这也就是我们常说的:不显著不代表没有。
那第二个问题,如果一个变量不显著,对其他的系数估计就没有影响吗?当然不是这样。比如在一个回归中有两个变量,x和w,两者都决定了y,但是做出来w不显著。如果w和x之间是相关的,此时如果删掉w的话,还是会导致遗漏变量问题:x的估计不再正确了。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论