2018-11-21
阅读量:
912
python的Q测试是什么?
导入相关库:
导入数据
为了开始执行离群值测试,我们将导入一些每10分钟采样的平均风速数据
说明:在任何数据集中, outlier
都是与其他数据点不一致的基准点。 如果从特定分布采样的数据具有高概率,则异常值将不属于该分布。 如果特定点是异常值,则有各种测试用于测试,这是通过常态测试中使用的相同的空假设测试来完成的。
Q测试
Dixon的Q-Test用于帮助确定是否有证据表明某个点是一维数据集的异常值。 假设数据集是正态分布的。 由于我们有非常有力的证据表明我们的数据集在所有正态检验都是正态分布 ,因此我们可以在此处使用Q-Test。 与正太检验一样,我们假设显着性水平为0.05美元,为简单起见,我们只考虑集合中的最小基准点。
对于我们的示例,Q统计量是集合中最小和最接近数字之间的绝对距离与数据集范围的比率。 这意味着:
对于我们的示例,我们将从包含完整数据集中的最小值的数据集中获取30个值,并对该样本应用测试。 然后我们将数组转换为列表并通过增加值对其进行排序。
0.0000
0
3
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
0条评论
0条评论
1条评论