
大数据构建互联网神经网络 护航民生安全
“民生”一词最早出现在《左传·宣公十二年》,所谓“民生在勤,勤则不匮”。 勤,最通俗的解释在于“尽力多做,不断地做。”《辞海》中对于“民生”的解释是“人民的生计”,百姓的生活来源和衣食住行问题。今天,在大数据时代,我们认为“勤”代表了大数据的科技智慧,我们看到民生正在借助科技的力量,让百姓的生活更加便捷智慧。
改善民生已经成为服务型政府的第一责任,以民为本、民生为先、民生为重、民生为上。那么,在信息社会,发挥大数据的价值,真正实现取之于民、用之于民已经成为了新时代改善民生的关键。
从马斯洛理论看社会民生
美国心理学家亚伯拉罕·马斯洛在1943年在《人类激励理论》论文中提出,人类需求像阶梯一样从低到高按层次分为五种,分别是:生理需求、安全需求、社交需求、尊重需求和自我实现需求。
在现代社会中,谈到这个由芸芸众生而组成的社会“民生”,我们认为,也由原来的生产、生活资料,上升为生活形态、文化模式、市民精神等既有物质需求也有精神特征的五个层面的整体样态。(如下图)
社会民生需求的几个层次
以人为本,服务于民
大数据时代的民生与安全问题密不可分。纷繁变化的今天,民生对社会管理提出更高要求,即时性考验政府的危机应急能力,同时也要不间断性保障民生安全、国家安全和信息安全。
在2014年,政府就已经明确将社会安全纳入到国家安全体系中,并赋予社会安全“保障”国家整体安全的重要职能。随着大数据技术的发展,特别是移动通信技术的革命,社交网络、数字媒体开始崛起,使得各类海量数据(短信、微信等即时通讯工具、卫星数据、无人机影像)能够被更为自由便利地使用,这正在根本性地改变社会安全问题的应对方式。
目前,中国已经成为名符其实的网络大国。截至2016年6月,中国网民规模达7.10亿。但现实的网络环境十分堪忧,网络诈骗层出不穷、网络入侵比比皆是、个人隐私肆意泄露。根据中国互联网协会发布的《中国网民权益保护调查报告(2015)》,63.4%的网民通话记录、网上购物记录等信息遭泄露;78.2%的网民个人身份信息曾遭泄露,因个人信息泄露、垃圾信息、诈骗信息等导致的总体损失约805亿元。2016年11月7日,全国人大常委会表决通过了《中华人民共和国网络安全法》。该法意义重大,影响深远,必将助力网络空间治理,护航“互联网+”与民生安全。
“互联网神经网络”为民生安全提供保障
在大数据时代,民生安全问题依赖“互联网神经网络”的感知、评价与决策。互联网的连通为大数据拓展、积累了巨量的个体资源、空间资源、数据资源和智慧资源;而大数据的融合所带来的革命,从深度上延伸了互联网链条,实现了连通的量变向融合的质变的跨越。大数据技术让互联网越来越智能,实现数据感知、数据评价和数据决策的更高阶段发展,模拟人的神经中枢来思考、判断和决策,为决策提供支撑,推动社会进步和组织改革。
在第三届世界互联网大会上,明略数据认为,互联网+大数据的真正价值在于建立“互联网神经网络”。互联网神经网络的建立遵循着从数据到智慧转换的四个步骤,这也是明略为企业提供大数据技术商业化服务的四张王牌,即数据、信息、洞察、智慧。这其中囊括了物联感知层、数据传输层、数据分析层以及数据展示层,他们所组成的互联网神经网络实现了从神经元到神经中枢,直到迅速输出控制指令。
互联网神经网络
正如,2015年凯文·凯利的新书《必然》所表达的,科技本身就像是一个生物,他在独自生长。今天的地球将被披上一层电子皮肤,各类电子装置、信号发射等将对人、物、组织等行为进行监控并彼此建立联系,网络节点每分每秒地传感数据,现实世界以数据形式呈现在人们面前,使人们有机会可以全面总览这个用数据描绘的现实世界。
随着大数据技术的发展与成熟,所谓“民生在勤,勤则不匮”正通过科技的方式实现,7x24小时永不停歇的“互联网神经网络”正在为社会民生安全提供保障。我们可以通过数据感知社会民生,用数据评价社会民生,并用数据决策社会民生。
在“互联网神经网络”的行业实践中,明略数据通过大数据平台承载复杂的“数据”,将复杂的结构化和非结构化数据治理成“信息”,再经过数据关联关系挖掘找到业务规律形成“洞察”,最后使用数据智能挖掘将经验转化为“智慧”。
数据、信息、洞察、智慧构建成一个强大、安全的平台。其中囊括物联感知层、数据传输层、数据分析层和数据展示层,组成互联网神经网络,从神经元,到神经中枢,直到迅速输出控制指令。
“全、快、准、稳”,安天下!
明略数据将“全、快、准、稳”的四大技术特性应用到民生大数据中,打造公共安全领域里的“互联网神经网络”,协助政府服务民生。
在这个过程中,明略数据就如同一个智慧生物体一样,通过处理更“全”数据,快速感知外界刺激—各类行为数据,准确分析欺诈风险并输出决策结果,并持续稳定地给予可靠反馈。
“全”,就是指处理领域涵盖整个互联网,在数据处理方面,形成一个颠覆性的、成规模和体系的架构。以金融反欺诈作为例子,首先需要处理海量金融数据,例如某家银行1年里发出的约4300万张卡的数据信息,以及该银行超过15000亿的交易数据,和超过3500万官网用户数据, 还有约1500万条/天的日志数据等。除此之外, 还需要处理网上的行为数据、属性数据等。明略的数据技术通过处理手机银行数据、网上银行数据、线上行为数据等全量数据,像生物体一样感知外界对自身的所有刺激,通过互联网进行全面“刺激”反馈。
“快”,是指高速响应、处置及时的大数据实时分析的能力。在获得全量数据后,时效非常关键。实时分析,快速发现问题,即刻采取行动,才能避免损失。以支付场景为例,银联每秒需要处理两万笔交易,且为了不影响用户的体验,在用户支付的瞬间,系统需要在毫秒内完成欺诈分析。像生物体神经网络接收刺激可以立即通过中枢神经做出反馈动作一样,明略数据本着与欺诈者进行时间赛跑的理念,利用多年积累的大数据技术能力,快速、实时分析各类行为数据,对欺诈行为瞬间做出反馈。
“准”,从分析的颗粒度划分上,从精细到个体,如同在浩如烟海的海量数据中抓住一粒沙子并判断其性质,增强预警能力。在当下注重服务体验的时代,从每秒两万笔交易数据中,准确的捕捉到欺诈行为,是非常重要的。明略数据通过精通反欺诈业务的行业专家和精通算法模型的大数据科学家协同研发,设计出严谨的大数据反欺诈模型,并通过机器学习不断提高精准度,确保金融交易的顺畅和安全。
“稳”,面对全量数据流的处理,快速的反馈,精准的预判,都需要一个稳定、可靠的、7x24小时可用的大数据平台,来保证互联网神经系统的持续运转。明略数据提供了一套覆盖物理网络、操作系统及整个内部的服务进程和服务元数据的软硬件结合的平台高可用性方案。任何单点故障,都不会影响整个平台服务的正常运行,保证元数据多备份,企业服务的正常运转。
互联网神经网络与金融风险控制
同时, 明略数据通过核心产品SCOPA,不断尝试类似“互联网神经网络”的行业实践,深入业务场景,解决实际问题。
在公安领域,明略数据通过SCOPA的应用颠覆了传统的以检索为核心的情报分析模式,实现了基于人员、组织、案(事)件、地点以及物品五要素之间关联关系的实时分析的情报模式。大数据技术对于公安的意义是提升破案效率和精准预警,尤其是后者。SCOPA强大的关联关系技术和大数据情报挖掘能力,能够帮助民警在最早的时间发现犯罪预谋,并且根据系统的实时分析,通过动态交互的可视化研判功能,快速且准确地锁定犯罪嫌疑人。大数据时代的到来为犯罪手段多样化和复杂化提供了土壤,但同时,新兴的技术力量成长得更加茁长,全国多地公安系统已经用SCOPA来打造更加智能的大数据情报分析系统,辅助更多的民警成为“神探”,用大数据技术捍卫民生安全。
在金融领域,明略数据创新性地为银行落地线上渠道实时反欺诈应用,每小时平均处理200万条线上交易行为,识别和处理欺诈风险。通过对海量行为数据和金融数据进行实时处理,实现“在线实时决策+离线机器学习”结合的解决方案,更高效地应对官网、网银、APP等线上渠道产生的虚假账号、伪装账号、异常登录、频繁登录等新型风险和欺诈行为,做到风险从异常行为出现到预警反馈用时0.1秒,实现快速出击,保障金融安全。
通过明略数据的‘数据、信息、洞察、智慧’独特的挖掘复杂数据价值的理论,截至目前,明略数据已为世界最大的铁路交通网,提供50+节点集群、500T终端采集数据的设备大数据预测挖掘服务;落地中国第一个税务大数据解决方案,实践首个实时大数据信用卡安全应用,承载实时监控每小时200万条交易流水记录。
明略数据“四张牌”建设大数据技术支持的互联网伸进该网络
大数据的应用看似“高大上”,但最重要的是以人为本,服务于民。明略数据将“全、快、准、稳”的四大特性应用到民生大数据中,在公共安全方面协助政府服务民生。明略的目标是要在公安领域成为智慧警察,在金融领域成为智慧风险控制师、审贷员,在医疗领域成为智慧医生。利用大数据技术,遵循普适化、中枢化、自发化的逻辑,为百姓、企业、产业、社会的进步和发展贡献力量,用科技改善民生,用大数据服务和谐社会,造福人类。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
训练与验证损失骤升:机器学习训练中的异常诊断与解决方案 在机器学习模型训练过程中,“损失曲线” 是反映模型学习状态的核心指 ...
2025-09-19解析 DataHub 与 Kafka:数据生态中两类核心工具的差异与协同 在数字化转型加速的今天,企业对数据的需求已从 “存储” 转向 “ ...
2025-09-19CDA 数据分析师:让统计基本概念成为业务决策的底层逻辑 统计基本概念是商业数据分析的 “基础语言”—— 从描述数据分布的 “均 ...
2025-09-19CDA 数据分析师:表结构数据 “获取 - 加工 - 使用” 全流程的赋能者 表结构数据(如数据库表、Excel 表、CSV 文件)是企业数字 ...
2025-09-19SQL Server 中 CONVERT 函数的日期转换:从基础用法到实战优化 在 SQL Server 的数据处理中,日期格式转换是高频需求 —— 无论 ...
2025-09-18MySQL 大表拆分与关联查询效率:打破 “拆分必慢” 的认知误区 在 MySQL 数据库管理中,“大表” 始终是性能优化绕不开的话题。 ...
2025-09-18DSGE 模型中的 Et:理性预期算子的内涵、作用与应用解析 动态随机一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明确:TIF 中的地名有哪两种存在形式? 在开始提取前,需先判断 TIF 文件的类型 —— ...
2025-09-17CDA 数据分析师:解锁表结构数据特征价值的专业核心 表结构数据(以 “行 - 列” 规范存储的结构化数据,如数据库表、Excel 表、 ...
2025-09-17Excel 导入数据含缺失值?详解 dropna 函数的功能与实战应用 在用 Python(如 pandas 库)处理 Excel 数据时,“缺失值” 是高频 ...
2025-09-16深入解析卡方检验与 t 检验:差异、适用场景与实践应用 在数据分析与统计学领域,假设检验是验证研究假设、判断数据差异是否 “ ...
2025-09-16CDA 数据分析师:掌控表格结构数据全功能周期的专业操盘手 表格结构数据(以 “行 - 列” 存储的结构化数据,如 Excel 表、数据 ...
2025-09-16MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11