2018-11-16
阅读量:
889
Python里面怎么做标准化呀
所有中心倾向的度量都是同一单位。极
差的单位也与此相同。 但是,方差的单位是原数据单位的平方(即“平方朋友”)。然而,
用方差很难给出直观的比较,所以我们更常使用标准差(standard deviation) :
def standard_deviation(x):
return math.sqrt(variance(x))
standard_deviation(num_friends) # 9.03
极差和标准差也都有我们之前提到的均值计算常遇到的异常值问题。再看之前的例子,如
果我们最具人缘的用户有 200 个朋友,标准差就变为 14.89,增加了 60% !
一种更加稳健的方案是计算 75% 的分位数和 25% 的分位数之差:
def interquartile_range(x):
return quantile(x, 0.75) - quantile(x, 0.25)
interquartile_range(num_friends) # 6
相对来说,这种计算不易受到一小部分异常值的影响。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论