2020-08-20
阅读量:
1696
上下边缘的计算为什么用1.5*IQR?
如果我们把数据集当成是服从正态分布的数据集,那么上下边缘的计算公式中的系数取1.5时,上边缘与下边缘这段区间的概率分布为99.3%,也就是数只有1%的可能会落在这个区间之外,是非常小的概率, 如果出现了这种情况,我们就可以认为这个数据的出现是会伴随着某些问题的出现. 也就是为什么在这个区间之外的点我们称为异常点(outliers)






评论(0)


暂无数据
推荐帖子
0条评论
0条评论