
判案预测:大数据PK83位法律专家_数据分析师
法律的生命不在于逻辑,而在于经验?经验与规律哪个更可靠?十余年前一场预测法官判案结果的PK,大数据计算程序出人意料地胜过了83位法律专家,这值得我们关注和思考。天同诉讼圈(微信号:tiantongsusong)今日为您推荐。
2001年,宾夕法尼亚大学法律系教授特德·鲁格(TedRuger)正在参加一个研讨会,听取安德鲁·马丁(Andrew Martin)和凯文·奎因(Kevin Quinn)两位政治学家关于一篇大数据分析文章的报告。马丁和奎因所报告的文章称,仅仅利用与案件政治特征相关的几个变量,他们就能预测出高等法院法官的投票结果。对此,特德不以为然。
特德看起来一点儿也不像大家平时看到的那些貌似身体瘦弱的学究们;他的身材像运动员一样健硕,长着方下巴,脸上虽然布满皱纹但容貌英俊。他听研讨会时,不喜欢那些政治学家们报告其研究结果的方式。“他们实际上用了预测这一术语,”他告诉我,“我坐在那里听,就像一个怀疑论者。”他不喜欢这篇文章,因为他们所做的是预测过去。“跟很多法律或政治科学研究一样,”他说,“这篇文章本质上也是针对过去的。”
因此,在研讨会结束后,他走到他们跟前提出自己的建议。“从某种意义上来说,这一项目的起源就是我事后跟他们说,为什么不做一个前向的检验呢?”他们谈着谈着,就决定进行一场比赛——“友好的跨学科竞赛”,比较一下预测高等法院案例审判结果的两种不同方法。一边是政治学家的大数据分析预测,另一边是83位法律专家的意见。他们的任务是提前预测每位法官对2002年高等法院审过的每个案件的投票结果。专家就是真实的法律资深人士,包括法律系教授、法律从业人员以及法律博学人士(共有38人担任过高等法院法官,33人有教授职称,5人担任或曾担任法律系主任)。大数据分析计算程序要对所有案件的所有法官的投票做出预测,而专家只需预测在他们所专长的领域内的案件投票情况。
令特德没想到的是,比赛结果竟然打成了平手。政治学家的模型考虑了如下六个因素:
(1)案件最初的巡回法庭;
(2)案发地区;
(3)原告类型(如美国、公司雇主,等等);
(4)被告类型;
(5)低等法院规章的意识形态倾向(自由还是保守);
(6)原告是否称某项法律或条例不符合宪法。
特德说:“我原本认为他们的模型包含了决策制定过程中太多没必要的细节,因此法律专家应该预测得更好一些。”对于法律和过去案件的透彻了解毕竟还是管点用的。
这个简单的检验指出了最基本的问题:什么是法律。法官奥利弗·文德尔·霍姆斯(Oliver Wendell Holmes)首创了法律预测说。“法律的生命不在于其逻辑性,而在于经验。”对霍姆斯来说,法律只不过是“对于法官会怎么做的一种预测”而已。霍姆斯不同意哈佛大学主任(也是苏格拉底式法律教育方法的权威)克里斯多夫·哥伦布·兰德尔(Christopher Columbus Langdell)的观点,后者认为“法律是一门科学,这门科学所有能够获得的资料都已经包含在教科书中了。”霍姆斯认为准确的预测与“时间的紧迫性、对于公共政策的直觉、公开或下意识的甚至对于与自己观念相同的法官的偏见”等等密切相关。
政治学中的主流统计模型都是霍姆斯模型,因为该模型几乎完全强调法官的偏见,即主观意识想法。政治学家常常会假设政治理念固定不变,并且服从从自由到保守的平滑分布。根据这种大数据分析计算程序得出的决策树只有细微差别。马丁和奎因使用这9名法官以前审过的628起案件的历史数据,首先考察何时这六大因素预测出的决策结果是一致同意审理或一致驳回上诉。然后,再使用同样的历史数据,针对没有达成一致意见的案件,找出能够最好地预测出每个法官投票的流程图(有条件地结合上述因素)。例如,下面这幅图就是真实研究中用来预测桑德拉·戴·奥康纳(Sandra Day O’Connor)法官的投票流程图。
资料来源:Andrew D. Martin et al,“Competing Approaches to Predicting SupremeCourt Decision Making,”2Perspectives on Politics 763 (2004)
这幅用于预测的流程图相当简单。第一个决策点预测只要低等法院的法案是“自由的”,奥康纳就会驳回上诉。因此,在“格鲁特对伯林杰”案(Grutter VS Bollinger)中,高等法院2002年所审案件挑战着密歇根大学法学院(Michigan Law School)同意审判的合宪决定,该模型仅仅因为低等法庭的审判(在支持法学院同意审判的决定方面)是自由的而错误地预测奥康纳会驳回上诉。如果低等法庭是“保守的”,流程图就会略微复杂一些,决定因素包括最初巡回法庭的预测、被告类型以及案件提交地区。当然,这种统计预测完全忽略了本案件及其之前该法庭所审案件的具体特定问题。而对特定问题了解深入的法律专家自然会做得更好一些。
请注意,使用统计模型时,我们仍然需要人来为案件编码。关键是要有专家来决定低等法庭的决策是“自由的”还是“保守的”。研究表明怎样使统计预测与主观判断相符且相关。统计决策规则不可能不依赖于专家或临床医生的主观判断。规则可以问护士是否认为病人看起来“感觉不舒服”。但这是一种不同寻常的专业知识。不需要依赖专家做出最终决策,专家只需要针对某个症状存在还是不存在给出意见。人类专家也许有一定的发言权,但是大数据分析方程限制了他们自由处置的能力。
特德“进行前向检验”的简单想法为进一步的检验铺平了道路。随着高等法院审判过程的进行,很多知情人都满怀兴趣等着看这项检验。做出最终决策之前,网站上会公布计算机和专家分别做出的预测,这样每个陪审员的观点提交上去时,人们就都可以直接看到结果了。
最后专家输了。对于2002年审判的所有案件,模型预测的法庭同意审判或驳回上诉的结果正确率为75%,而所有法律专家一起只预测对了59.1%。在预测奥康纳法官和肯尼迪的关键选票上,大数据分析尤为有效。对于奥康纳的选票,模型预测正确率为70%,而专家的正确率仅为60%。
极为简化的统计模型的预测能力不仅胜过律师,而且胜过拥有案件详细信息的该领域专家,这怎么可能呢?这一结果只是统计上的反常现象吗?它与法律界的特质或自大有没有关系?简单地回答,特德的检验代表了更加一般意义上的现象。几十年来,社会学家一直在比较大数据天才与传统专家的预测谁更准确。一个又一个的研究表明,大数据天才有占上风的趋势。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
LSTM 模型输入长度选择技巧:提升序列建模效能的关键 在循环神经网络(RNN)家族中,长短期记忆网络(LSTM)凭借其解决长序列 ...
2025-07-11CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-11数据透视表中两列相乘合计的实用指南 在数据分析的日常工作中,数据透视表凭借其强大的数据汇总和分析功能,成为了 Excel 用户 ...
2025-07-11尊敬的考生: 您好! 我们诚挚通知您,CDA Level I和 Level II考试大纲将于 2025年7月25日 实施重大更新。 此次更新旨在确保认 ...
2025-07-10BI 大数据分析师:连接数据与业务的价值转化者 在大数据与商业智能(Business Intelligence,简称 BI)深度融合的时代,BI ...
2025-07-10SQL 在预测分析中的应用:从数据查询到趋势预判 在数据驱动决策的时代,预测分析作为挖掘数据潜在价值的核心手段,正被广泛 ...
2025-07-10数据查询结束后:分析师的收尾工作与价值深化 在数据分析的全流程中,“query end”(查询结束)并非工作的终点,而是将数 ...
2025-07-10CDA 数据分析师考试:从报考到取证的全攻略 在数字经济蓬勃发展的今天,数据分析师已成为各行业争抢的核心人才,而 CDA(Certi ...
2025-07-09【CDA干货】单样本趋势性检验:捕捉数据背后的时间轨迹 在数据分析的版图中,单样本趋势性检验如同一位耐心的侦探,专注于从单 ...
2025-07-09year_month数据类型:时间维度的精准切片 在数据的世界里,时间是最不可或缺的维度之一,而year_month数据类型就像一把精准 ...
2025-07-09CDA 备考干货:Python 在数据分析中的核心应用与实战技巧 在 CDA 数据分析师认证考试中,Python 作为数据处理与分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 检验:数据趋势与突变分析的有力工具 在数据分析的广袤领域中,准确捕捉数据的趋势变化以及识别 ...
2025-07-08备战 CDA 数据分析师考试:需要多久?如何规划? CDA(Certified Data Analyst)数据分析师认证作为国内权威的数据分析能力认证 ...
2025-07-08LSTM 输出不确定的成因、影响与应对策略 长短期记忆网络(LSTM)作为循环神经网络(RNN)的一种变体,凭借独特的门控机制,在 ...
2025-07-07统计学方法在市场调研数据中的深度应用 市场调研是企业洞察市场动态、了解消费者需求的重要途径,而统计学方法则是市场调研数 ...
2025-07-07CDA数据分析师证书考试全攻略 在数字化浪潮席卷全球的当下,数据已成为企业决策、行业发展的核心驱动力,数据分析师也因此成为 ...
2025-07-07剖析 CDA 数据分析师考试题型:解锁高效备考与答题策略 CDA(Certified Data Analyst)数据分析师考试作为衡量数据专业能力的 ...
2025-07-04SQL Server 字符串截取转日期:解锁数据处理的关键技能 在数据处理与分析工作中,数据格式的规范性是保证后续分析准确性的基础 ...
2025-07-04CDA 数据分析师视角:从数据迷雾中探寻商业真相 在数字化浪潮席卷全球的今天,数据已成为企业决策的核心驱动力,CDA(Certifie ...
2025-07-04CDA 数据分析师:开启数据职业发展新征程 在数据成为核心生产要素的今天,数据分析师的职业价值愈发凸显。CDA(Certified D ...
2025-07-03