1) 极差
极差=最大值-最小值
极差对数据集的极端值非常敏感, 并且忽略了位于最大值与最小值之间
的数据是如何分布的。
(2) 标准差
标准差度量数据偏离均值的程度
(3) 变异系数
变异系数度量标准差相对于均值的离中趋势,变异系数主要用来比较两个或多个具有不同单位或不同波动幅度的数据
集的离中趋势。
(4) 四分位数间距
四分位数包括上四分位数和下四分位数。 将所有数值由小到大排列并分
成四等份, 处于第一个分割点位置的数值是下四分位数, 处于第二个分割点
位置(中间位置) 的数值是中位数, 处于第三个分割点位置的数值是上四分
位数。
四分位数间距是上四分位数QU与下四分位数QL之差, 其间包含了全部
观察值的一半。 其值越大, 说明数据的变异程度越大; 反之, 说明变异程度
越小。
针对餐饮销量数据进行统计量分析
##设置工作空间
#把“数据及程序” 文件夹复制到F盘下, 再用setwd设置工作空间
setwd("F: /数据及程序/chapter3/示例程序")
#读入数据
saledata=read.table(file="./data/catering_sale.csv", sep=", ", header=TRUE)
sales=saledata[, 2]
#统计量分析
#均值
mean_ = mean(sales, na.rm=T)
#中位数
median_ = median(sales, na.rm=T)
#极差
range_ = max(sales, na.rm=T) -min(sales, na.rm=T)
std_ = sqrt(var(sales, na.rm=T) )
#变异系数
variation_ = std_/mean_#四分位数间距
q1 = quantile(sales, 0.25, na.rm=T)
q3 = quantile(sales, 0.75, na.rm=T)
distance = q3-q1
a=matrix(c(mean_, median_, range_, std_, variation_, q1, q3, distance) , 1, byrow=T)
colnames(a) =c("均值", "中位数", "极差", "标准差", "变异系数", "1/4分位数", "3/4分位数
print(a)
#标准差
暂无数据