2018-11-01
阅读量:
2175
双变量分析
堆积柱形图
堆积柱形图是一个有用的图形,用于可视化两个分类变量之间的关系。它比较了来自一个变量的每个类别对第二个变量的类别的总和所占的百分比。

组合图
组合图表使用两种或更多图表类型来强调图表包含不同类型的信息。在这里,我们使用条形图显示一个分类变量的分布和折线图,以显示第二个分类变量中所选类别的百分比。组合图是最好的可视化方法,用于演示预测器(X轴)对目标(Y轴)的可预测性。

卡方检验
卡方检验可用于确定分类变量之间的关联。它基于频率表中一个或多个类别中预期频率(e)和观测频率(n)之间的差异。卡方分布返回计算的卡方和自由度的概率。概率为零表示两个分类变量之间的完全依赖性,概率为1表示两个分类变量完全独立。Tchouproff Contingency Coefficient测量两个分类变量之间的依赖程度。

示例:以下频率表(列联表)的卡方为10.67,自由度(df)为2,概率为0.005表示两个分类变量(头发和眼睛颜色)之间的显着依赖性。







评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论