大数据时代 交通电子警察如何发展
随着大数据时代的来临,通过资料的收集、整理、分析、统计等方法,准确及时地掌握交通违法系统中各种动态、静态信息,提取交通违法行为在时间、空间、违法类型上的分布特征,可以从多个维度对交通违法数据进行分析,有助于探索出更加科学有效的交通违法治理科学方法,为非现场交通执法这一领域的发展提供有益的参考,以期更加富有成效地开展交通违法治理、维护道路交通秩序、预防和减少交通事故,为经济和社会发展创造和谐的道路交通环境。
1 交通违法数据分析基础
1.1 交通违法数据库概况
公安交通管理综合应用平台(通常称为“6合1平台”)是公安部推广的全国性应用平台,交通违法数据存储在该平台的交通违法数据库中,用到的数据库表包括:trff_app.vio_surveil(简称surveil表)、trff_app.vio_force(简称force表)和trff_app.vio_violation(简称violation表)。其中,surveil表记录了交通违法处理前的所有非现场执法数据;force表记录了交通违法处理前的所有一般程序执法数据(包括现场执法和非现场执法);violation表记录了交通违法处理前的所有简易程序的现场执法数据,同时,上述3个数据库表中的数据,在违法当事人办理完成交通违法处理手续后,都将进入到violation表中。3个数据库表之间的关系如下图所示:
数据库表关系图
1.2 可非现场执法的交通违法行为
根据《道路交通安全违法行为代码及处罚标准(2014年版)》,机动车驾驶人违法代码中,适用简易程序的违法代码有258种,适用一般程序的违法代码有113种,可以单独使用强制措施的违法代码16种(强制措施共105种,其中89种与简易程序或一般程序重复),合计共387种违法代码。按照现有市场上非现场执法设备的种类和发展水平,筛选出可以进行非现场执法的交通违法行为共92种,占机动车驾驶人违法行为总数的23.8%。可非现场执法交通违法行为主要集中在违反交通标志或标线(包含了压实线、不按导向车道行驶、不按规定车道行驶、逆行、倒车、进入禁行范围、超过规定时速、低于规定时速、停车等)和违反交通信号灯指示的违法行为。近年来由于高清摄像机、视频分析和大数据技术的发展,非现场执法在涉及司乘人员的违法行为(如不系安全带)、涉及号牌的违法行为(如遮挡号牌、污损号牌、不悬挂号牌等)方面有了进一步的突破。
2 交通违法数据分布特征
2.1 时间分布特征
通过统计广州市非现场执法数据的取证时间,可以发现,非现场执法数据在时间上的分布总体上具有以下特征:
日相似性:虽然每天的违法数据的变化趋势波形略有差异,但同一采集对象的曲线波形相似,变化趋势呈明显的周期性。在每天的同一时段,违法数据呈现出极其相似的变化趋势。
连续性:时间序列数据具有连续性,序列中的每一个采集数据对相邻时段的记录数据都有承上启下的特点(投入使用的电子警察数量发生变化除外)。
相对稳定性:在每一较短时段内,违法数据的时间变化趋势相对稳定。
执法主体相关性:非现场执法技术手段中,对违法行为的取证方式包括完全依靠设备和人工与设备结合两种。完全依靠设备的非现场执法量,节假日与工作日的差距非常小;而人工与设备结合的非现场执法量,节假日明显低于工作日。
流量相关性:排除执法主体的影响,只考察完全依靠设备的非现场执法量,在一天24小时中总体呈现为正态分布,其峰值主要出现在10时-16时之间。高峰时段为全天交通流量较大的时段,但并没有呈现早晚高峰的特征。
2.2 空间分布特征
考虑到交通违法量在空间上的分布,不仅与非现场执法量在空间上的分布有关,还与非现场执法点在空间上的分布有关,为了屏蔽非现场执法点数量在空间上分布不均对评价某区域交通违法严重程度的影响,定义“单位执法量=非现场执法量/非现场执法地点数量”来作为衡量指标。可以发现,非现场执法数据在空间上的分布总体上具有以下特征:
极不均匀性:非现场执法量在空间上的分布是极其不均匀的。占比80%的非现场执法量,发生在占违法地点总量15.6%的违法地点。 城郊差异性:郊区的单位执法量略高于城区的单位执法量。
道路级别差异性:单位执法量在道路级别上的分布按照高速公路、城市快速路、城市一般道路逐级递减。
2.3 违法行为分布特征
非现场执法数据在违法行为上的分布也体现出极不均匀的特征,占比84%的非现场执法量,发生在占比10%的违法行为上。
非现场执法量最为突出的交通违法行为是:违法停车、违反禁令标志、违反禁止标线、超速、闯红灯、不按导向车道行驶、违规使用专用车道。这一特征除了与交通违法行为自身的统计特征有关之外,还与现有非现场执法手段的技术可实现有关。例如,涉及号牌(包括未悬挂号牌、故意遮挡号牌、故意污损号牌等)的交通违法行为,现场执法量反映该违法行为也较为突出,但因技术手段原因,现阶段的非现场执法量几乎为零。
3 大数据环境下交通电子警察发展策略
电子警察是智能交通管理系统大框架中的重要组成部分,也是在对图像和视频数据进行语义化、结构化处理方面应用最深的领域。从技术角度,电子警察系统也是智能交通行业中率先引入大数据、云计算技术架构,突破数据应用瓶颈的一个技术领域。下一步,继续提高非现场执法比例、解放警力的途径,可以从以下3个方面考虑。
3.1 科学布局定点
当前国内几乎所有城市都拥有一定数量的电子警察,早期的电子警察布点“粗放式”的特征比较明显,这一特征只适合于电子警察系统建设的起步阶段,随着系统规模的逐步扩大和系统功能的日渐完善,也就对电子警察布点的科学性提出了更高的要求。需要进一步以管理需求为导向,以交通特征为标尺,兼顾交通安全管理、交通秩序管理和交通执法管理等方面的需求,综合考虑道路等级、交通区位、交通功能、交通运作特征等方面的客观条件,从交通执法数据所呈现出来的数据特征出发,分析评估当前电子警察布局的合理性,并将分析结果作为电子警察下一步建设和运行维护管理的指导意见,具体如下:
(1)对于现场执法量较大,而且该违法行为又可以采用非现场执法的,尽量采用非现场执法;
(2)加大已有非现场执法中设备自动采集取证的比例,将进行人工(或半自动)非现场执法的警力也解放出来;
(3)持续优化调整电子警察的点位,迁移改造社会效益不大且执法数量很少的电子警察。
3.2 持续提升智能化水平
目前,高清化、智能化的电子警察前端已成为主流,实时、自动地捕获进入特定范围的车辆,识别信号灯状态、识别车辆牌照,已经成为此类电子警察前端设备的标准配置。然而,现有的前端智能化水平还远不能满足交通管理实战应用的期望,智能化面临着新的挑战,主要体现在3个方面:一是综合识别率指标(包括捕获率、识别率等)的继续提升,从当前90%的要求,提升至95%甚至更高;二是外部场景适应性的提升,在电子警察的实际应用中,其算法需要进一步适应各种各样的自然环境变化,如强逆光、强顺光、强阴影、低照度、雨雪天、对向车辆远光灯等多种干扰因素,因此需要引入领先的机器学习和图像处理算法,通过收集现场某一类场景的场景对算法进行训练,最终将训练结果反馈到前端设备;三是增值特征识别与应用,大力拓展图像识别的目标范围,从单一的车牌识别过渡到车型、车标、年款、车身颜色、号牌颜色等多维度的车辆信息识别,以及驾驶人脸部特征、不系安全带、开车打电话等驾驶人信息识别,从而拓展非现场执法在“违法行为”维度的空间。
3.3 创新执法模式
在上文所述92中可非现场执法的交通违法类型中,“上道路行驶的机动车未悬挂机动车号牌的(1717)”、“故意遮挡机动车号牌的(1718)”、“故意污损机动车号牌的(1719)”、“不按规定安装机动车号牌的(1720)”这4种交通违法行为,属于涉牌违法行为,非现场执法难度较大。在大数据的时代背景下,通过创新执法模式,采用“设备提供线索信息、民警精准现场执法”这种线上和线下互动配合的方式,可以有效打击上述违法行为。具体是通过分析车辆通过电子警察的数据(包括治安卡口、和电子警察采集的数据,下一步可以扩展至停车场及高速公路收费站的数据),提取图像识别所提供的车型、车标、年款、车身颜色、号牌颜色等车辆信息,得出车辆的行驶轨迹。然后通过对目标车辆在一段时间内活动轨迹进行分析,可以判断出该车辆在某一范围的出现频度、时段,实现对单体行为习惯的有效预测,并将预测结果提供给路面民警,从而实现对违法车辆的精准现场执法。
4 结语
广州市交通电子警察系统经过16年的发展建设,已经形成了较大的规模,非现场执法也成为了交通执法的主力军,通过深度挖掘电子警察运行产生的各种数据,开展交通违法数据的统计、关联分析和评估,指导电子警察在布局定点、智能化方向、执法模式等方面的发展策略,大数据在广州市近几年的智能交通设施规划与评估中得到了较好地应用与实践。展望未来,智能交通设施评估将在交通安全、交通环境及交通运营等角度切入,进一步深化与拓展大数据分析评估技术。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31