一、数据:
高级数据可转化为低级数据(定量数据可转化为定性数据),推出一个重要规律:
一个重要的规律:低级数据的方法高级数据可以用,但高级数据的 方法低级数据不可以用
二、描述统计:
(五个角度分析)
1.总体规模的描述——总量指标
• 按内容分:单位总量指标(人、物、…)、标志总量指标 (营业额、利润、…)
• 按时间不同分:时期指标、时点指标
• 按计量不同分:实物指标、价值指标、劳动量指标
2..对比关系的描述——相对指标
计划完成程度相对指标:实际完成/计划完成
结构相对指标:部分/总体
比例相对指标:一部分/另一部分
比较相对指标:A的指标/B的相同指标
强度相对指标:某总量指标/另一性质不同但关联的总量指标
动态相对指标:报告期/基期
3.集中趋势的描述——平均指标
(一)众数(mode) <分类数据的方法>
1.定义:出现次数最多的变量值
2.表示的符号:M
3.计算:寻找数据中出现次数最多的值。
(二)分位数<顺序数据的方法>
1.中位数(median)
2.四分位数(quartile)
(三)均值(所有数据共同参与的同级运算)(数据的重心/平衡点)(分为简单和加权)<数值型数据的方法>
1.算术平均数,受max的影响>受min的影响
2.调和平均数,受min的影响>受max的影响
3.几何平均数,受min的影响=受max的影响
4.幂平均数,通式,是k的递增函数,当k=1时,是算术平均数; 当k=-1时,是调和平均数; 当k=0时,是几何平均数
4.离散程度的描述——变异指标
1.极差(range)
2.平均差(mean deviation)
3.方差和标准差(variance and standard deviation)
自由度=n-约束条件的个数(不等价)
4.相对离散程度:离散系数 (coefficient of variation)
5.分布形态的描述——偏态与峰态
一.偏态(skewness)
1.定义:是指数据分布偏斜程度
2.测量方法:使用偏态系数来测度数据的偏态。偏 态系数用符号SK表示
3.偏态的判断:
①是否存在:SK=0对称分布;SK>0右偏分布(存在极大值);SK<0左偏分布(存在极小值)
②偏态的程度: 0-0.5低度偏态分布;0.5-1中等偏态分布; >1高度偏态分布。
4.偏态对众数、中位数和均值之间关系的影响
对称分布:均值=中位数=众数
左偏分布:均值<中位数<众数
右偏分布:众数<中位数<均值
二.峰态(kurtosis)
1.定义:是指数据分布的扁平程度。 由统计学家Pearson于1905年首次提出
2.测量方法:使用峰态系数来测度数据的偏态。 峰态系数用符号K表示
3.峰态的判断:
①是否存在:K=0扁平峰度适中; K> 0尖峰分布; K< 0扁平分布
②偏态的程度:0-0.5低度尖峰分布;0.5-1中等尖峰分布;>1高度尖峰分布
正态分布:任何分布、任何统计量随着其自由度或样本增大,都符合正态分布








暂无数据