图表将复杂的数据转变为清晰的可视化效果,能直观体现数据间关系
比较类:柱状图、条形图、折线图、雷达图
构成类:饼图、树状图、旭日图
分布、联系:散点图、气泡图
统计类:直方图、箱型图
树状图:结构比较,用于展现多层级下数据间的比例分布情况
旭日图:结构比较,用于展示多层级间数据的对比关系
散点图:两列数值的相关性
气泡图:三维数值的相关性
直方图:实现对象等级的频数统计
箱型图:
补充百分位:从升序排列的数值型数据中选取特定百分位的数值。
例:1,3,4,5,7,11,13,24,26,31
计算逻辑:确定所选位置;选取指定位置的数值
50%位(即中位)=(10+1)/2=5.5
50%位数=9
75%位=(10+1)*0.75=8.25
75%位数= 24+(26-24)*0.25=24.5
箱型图
体现单类别或多类别数据间的相关性,快速了解一批数值四分值、平均值及离散值的分布情况
例如:1, 3, 4, 5, 7, 8, 11, 13, 31
步骤:下四分位=(9+1)/4=2.5
下四分位数=3*0.5+4*0.5=3.5
上四分位=3*(9+1)/4=7.5
上四分位数=11*0.5+13*0.5=12
IQR(四分距)= 上四分位数-下四分位数=12-3.5=8.5
下边缘=下四分位数-1.5IQR=3.5-1.5*8.5=-9.25<1
计算得出的下边缘不在数列中时选择大于且离下边缘最近的数值作为下边缘
上边缘=上四分位数+1.5IQR=12+1.5*8.5=24.75<31
上边缘=13
计算得出的上边缘不在数列中时选择小于且离上边缘最近的数值作为上边缘
暂无数据