热线电话:13121318867

登录
2022-07-16 阅读量: 750
什么是辛普森悖论?

“狡猾”的数据-辛普森悖论
先来做个选择感受一下:
A医院:1000病人,900活,100死,存活率90%
B医院:1000病人,800活,200死,存活率80%
你会选择哪家医院?
1、 肯定A医院啊,存活率更高
2、 犹豫一下B医院,存活率也不低
3、 观望观望,具体问题具体分析


若你简单选择了A医院,此时你就中了“狡猾”数据的计了
为什么?让我们来将重症患者于轻症患者分开看看:
A医院:100重症,30活,70死,存活率30%;900轻症,870活,30死,存活率96.7%
B医院:400重症,210活,190死,存活率52.5%;600轻症,590活,10死,存活率98.3:

很明显,无论是轻症还是重症,B医院的存活率都高于A医院。
所以,
如果只看总体的存活率,A医院是个不错的选择
但区分了轻重症患者后,更好的选择则变成了B医院。
这就体现了辛普森悖论——即是指同一组数据,在分开讨论时和合并讨论时得出的结果可能截然不同。这种不符合常规认知的“悖论”现象,在数据分析领域并不少见。

0.0000
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子