2018-11-20
阅读量:
1051
分布特征、其他趋势的描述指标
除了以上两大基本趋势外,随着对数据特征了解的逐步深入,研究者常常会提出假设, 认为该数据所在的总体应当服从某种分布。那么,针对每一种分布类型,都可以由一系列 的指标来描述数据偏离分布的程度。例如对正态分布而言,偏度系数和峰度系数可以用来 反映当前数据偏离正态分布的程度。相对而言,这些分布指标使用得较少。 由于假定的分布不同,所使用的分布特征描述指标也会有所差异,这里我们只简单介 绍和正态分布有关的偏度系数及峰度系数的概念。 偏度(Skewness):用来描述变量取值分布形态的统计量,指分布不对称的方向和程 度。样本的偏度系数记为 g1,偏度是与正态分布相比较而言的统计量。g1>0 分布 为正偏或右偏,即长尾在右,峰尖偏左;g1<0 分布为负偏或左偏,即长尾在左, 峰尖偏右;g1=0 分布为对称状态。 峰度(Kurtosis):用来描述变量取值分布形态陡缓程度的统计量,是指分布图形的 尖峭程度或峰凸程度。样本的峰度系数记为 g2。峰度也是与正态分布相比较而言 的统计量,g2>0 即峰的形状比较尖,比正态分布峰要陡峭;g2<0 即形状比正态分 布平坦;g2=0 分布为正态峰。 除上述几类指标外,统计描述中还可能需要描述一些上文未提到的数据趋势,比如数 据呈单峰还是双峰分布,数据是否存在极端值等,常用的有专门针对异常值数据进行描述 的极端值(Outlier)列表等。
0.0000
0
3
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
0条评论
0条评论
1条评论