如何做描述统计分析(撰写一 份数据描述统计分析报告)?
五个角度:
一.总体规模的描述——总量指标
二.对比关系的描述——相对指标
三.集中趋势的描述——平均指标
四.离散程度的描述——变异指标
五.分布形态的描述——偏态与峰态
一.总体规模的描述——总量指标
总量指标:反映在一定时间.空间条件下某种现象 的总体规模、总水平或总成果的统计指标
二.对比关系的描述——相对指标
相对指标:又称“相对数”,是两个有相互联系的指标数值 之比
常用相对指标的计算
⚫计划完成程度相对指标:实际完成/计划完成
⚫结构相对指标:部分/总体
⚫比例相对指标:一部分/另一部分
⚫比较相对指标:A的指标/B的相同指标
⚫强度相对指标:某总量指标/另一性质不同但关联的总量指标
⚫动态相对指标:报告期/基期
三.集中趋势的描述——平均指标
集中趋势 定义:一组数据向其中心值靠拢的趋势
测度集中趋势就是寻找数据水平的代表值或中心值
(一)众数(mode) 1.定义:出现次数最多的变量值 2.表示的符号: 3.计算:寻找数据中出现次数最多的值 众数的不唯一性
(二)分位数 【分位数:是指根据对数据位置进行划分,处于某些 特定位置上的数。常用的分位数有二分位数(也叫“中 位数”)、四分位数、十分位数、百分位数等,这里重 点讲中位数和四分位数。】
中位数(median) ①定义:数据排序后,处于中间位置上的值; ②表示的符号: ③计算:数据的个数为 ,则 中位数位置=(n+1)/2
2.四分位数(quartile) ①定义:四分位数分下四分位数和上四分位数两种, 指排序后处于25%和75%位置上的值。 ②表示的符号:下四分位数 QL,上四分位数QU ③计算:数据的个数为n ,则
下四分位数 QL的位置: n/4
上四分位数 QU的位置:3n/4
三.数值型数据:均值(mean) 算术平均数 调和平均数 几何平均数 幂平均数
四.离散程度的描述——变异指标
离散程度 1.定义:反映各变量值远离其中心值的程度,是数 据分布的另一个重要特征 2.从另一个侧面说明了集中趋势测度值的代表程度
1.极差(range) (1)定义:一组数据的最大值与最小值之差; (2)表示的符号:R (3)计算:R = max(xi) - min(xi) (4)特点: ①离散程度的最简单测度值 ②极易受极端值影响 ③未考虑数据的分布
五.分布形态的描述——偏态与峰态
暂无数据