判案预测:大数据PK83位法律专家_数据分析师
法律的生命不在于逻辑,而在于经验?经验与规律哪个更可靠?十余年前一场预测法官判案结果的PK,大数据计算程序出人意料地胜过了83位法律专家,这值得我们关注和思考。天同诉讼圈(微信号:tiantongsusong)今日为您推荐。
2001年,宾夕法尼亚大学法律系教授特德·鲁格(TedRuger)正在参加一个研讨会,听取安德鲁·马丁(Andrew Martin)和凯文·奎因(Kevin Quinn)两位政治学家关于一篇大数据分析文章的报告。马丁和奎因所报告的文章称,仅仅利用与案件政治特征相关的几个变量,他们就能预测出高等法院法官的投票结果。对此,特德不以为然。
特德看起来一点儿也不像大家平时看到的那些貌似身体瘦弱的学究们;他的身材像运动员一样健硕,长着方下巴,脸上虽然布满皱纹但容貌英俊。他听研讨会时,不喜欢那些政治学家们报告其研究结果的方式。“他们实际上用了预测这一术语,”他告诉我,“我坐在那里听,就像一个怀疑论者。”他不喜欢这篇文章,因为他们所做的是预测过去。“跟很多法律或政治科学研究一样,”他说,“这篇文章本质上也是针对过去的。”
因此,在研讨会结束后,他走到他们跟前提出自己的建议。“从某种意义上来说,这一项目的起源就是我事后跟他们说,为什么不做一个前向的检验呢?”他们谈着谈着,就决定进行一场比赛——“友好的跨学科竞赛”,比较一下预测高等法院案例审判结果的两种不同方法。一边是政治学家的大数据分析预测,另一边是83位法律专家的意见。他们的任务是提前预测每位法官对2002年高等法院审过的每个案件的投票结果。专家就是真实的法律资深人士,包括法律系教授、法律从业人员以及法律博学人士(共有38人担任过高等法院法官,33人有教授职称,5人担任或曾担任法律系主任)。大数据分析计算程序要对所有案件的所有法官的投票做出预测,而专家只需预测在他们所专长的领域内的案件投票情况。
令特德没想到的是,比赛结果竟然打成了平手。政治学家的模型考虑了如下六个因素:
(1)案件最初的巡回法庭;
(2)案发地区;
(3)原告类型(如美国、公司雇主,等等);
(4)被告类型;
(5)低等法院规章的意识形态倾向(自由还是保守);
(6)原告是否称某项法律或条例不符合宪法。
特德说:“我原本认为他们的模型包含了决策制定过程中太多没必要的细节,因此法律专家应该预测得更好一些。”对于法律和过去案件的透彻了解毕竟还是管点用的。
这个简单的检验指出了最基本的问题:什么是法律。法官奥利弗·文德尔·霍姆斯(Oliver Wendell Holmes)首创了法律预测说。“法律的生命不在于其逻辑性,而在于经验。”对霍姆斯来说,法律只不过是“对于法官会怎么做的一种预测”而已。霍姆斯不同意哈佛大学主任(也是苏格拉底式法律教育方法的权威)克里斯多夫·哥伦布·兰德尔(Christopher Columbus Langdell)的观点,后者认为“法律是一门科学,这门科学所有能够获得的资料都已经包含在教科书中了。”霍姆斯认为准确的预测与“时间的紧迫性、对于公共政策的直觉、公开或下意识的甚至对于与自己观念相同的法官的偏见”等等密切相关。
政治学中的主流统计模型都是霍姆斯模型,因为该模型几乎完全强调法官的偏见,即主观意识想法。政治学家常常会假设政治理念固定不变,并且服从从自由到保守的平滑分布。根据这种大数据分析计算程序得出的决策树只有细微差别。马丁和奎因使用这9名法官以前审过的628起案件的历史数据,首先考察何时这六大因素预测出的决策结果是一致同意审理或一致驳回上诉。然后,再使用同样的历史数据,针对没有达成一致意见的案件,找出能够最好地预测出每个法官投票的流程图(有条件地结合上述因素)。例如,下面这幅图就是真实研究中用来预测桑德拉·戴·奥康纳(Sandra Day O’Connor)法官的投票流程图。
资料来源:Andrew D. Martin et al,“Competing Approaches to Predicting SupremeCourt Decision Making,”2Perspectives on Politics 763 (2004)
这幅用于预测的流程图相当简单。第一个决策点预测只要低等法院的法案是“自由的”,奥康纳就会驳回上诉。因此,在“格鲁特对伯林杰”案(Grutter VS Bollinger)中,高等法院2002年所审案件挑战着密歇根大学法学院(Michigan Law School)同意审判的合宪决定,该模型仅仅因为低等法庭的审判(在支持法学院同意审判的决定方面)是自由的而错误地预测奥康纳会驳回上诉。如果低等法庭是“保守的”,流程图就会略微复杂一些,决定因素包括最初巡回法庭的预测、被告类型以及案件提交地区。当然,这种统计预测完全忽略了本案件及其之前该法庭所审案件的具体特定问题。而对特定问题了解深入的法律专家自然会做得更好一些。
请注意,使用统计模型时,我们仍然需要人来为案件编码。关键是要有专家来决定低等法庭的决策是“自由的”还是“保守的”。研究表明怎样使统计预测与主观判断相符且相关。统计决策规则不可能不依赖于专家或临床医生的主观判断。规则可以问护士是否认为病人看起来“感觉不舒服”。但这是一种不同寻常的专业知识。不需要依赖专家做出最终决策,专家只需要针对某个症状存在还是不存在给出意见。人类专家也许有一定的发言权,但是大数据分析方程限制了他们自由处置的能力。
特德“进行前向检验”的简单想法为进一步的检验铺平了道路。随着高等法院审判过程的进行,很多知情人都满怀兴趣等着看这项检验。做出最终决策之前,网站上会公布计算机和专家分别做出的预测,这样每个陪审员的观点提交上去时,人们就都可以直接看到结果了。
最后专家输了。对于2002年审判的所有案件,模型预测的法庭同意审判或驳回上诉的结果正确率为75%,而所有法律专家一起只预测对了59.1%。在预测奥康纳法官和肯尼迪的关键选票上,大数据分析尤为有效。对于奥康纳的选票,模型预测正确率为70%,而专家的正确率仅为60%。
极为简化的统计模型的预测能力不仅胜过律师,而且胜过拥有案件详细信息的该领域专家,这怎么可能呢?这一结果只是统计上的反常现象吗?它与法律界的特质或自大有没有关系?简单地回答,特德的检验代表了更加一般意义上的现象。几十年来,社会学家一直在比较大数据天才与传统专家的预测谁更准确。一个又一个的研究表明,大数据天才有占上风的趋势。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/go ...
2025-03-12以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-11随着数字化转型的加速,企业积累了海量数据,如何从这些数据中挖掘有价值的信息,成为企业提升竞争力的关键。CDA认证考试体系应 ...
2025-03-10