北京用大数据打击非法集资揭秘_数据分析师考试
自今年5月北京“打击非法集资监测预警平台”上线以来,已关注到400多家机构有非法集资嫌疑,目前已向公安报送35起涉嫌非法集资的线索,其中包括20家P2P机构、5家PE机构、10家第三方理财机构
借助互联网技术的发展,互联网金融异军突起,鱼龙混杂之下,借金融创新之名行非法集资之实的企业也多了起来。
一场轰轰烈烈的打击非法集资行动正在开展中。根据国务院要求和市委市政府工作部署,从2015年4月到8月,北京市将开展打击非法集资专项整治行动。
记者在采访中了解到,与以往不同的是,此次北京市运用了已经建成的“打击非法集资监测预警平台”,通过大数据采集、分析技术,全天候无缝隙地对非法集资活动进行监测预警。大数据已经由企业商用扩展至服务于政府的执法工作。
6月2日,北京市金融工作局副巡视员沈鸿在接受法治周末记者采访时表示,自今年5月该大数据监测平台上线以来,已经关注到400多家机构存有非法集资嫌疑,目前北京市金融局已向公安部门报送了35起涉嫌非法集资的线索,其中包括20家P2P机构、5家PE机构、10家第三方理财机构。
传统打非手段存局限
据北京市打非办披露,目前北京市非法集资案件高发频发,呈现出案件规模快速上升,人均涉案金额明显增加,大案要案多发的特点。仅2014年北京就新发非法集资案件89件,集资人2.1万人,涉案金额172.6亿元。同比增长了2.56倍、5.65倍、56.9倍。
在上述案件中,P2P网贷类、投资理财类、私募股权投资类等案件呈爆发态势。公开信息显示,截至今年1月,北京已经出现了18家P2P网贷问题平台,包括跑路、诈骗、经营困难等现象。其中共立案网金宝、里外贷等4家P2P类非法集资案件,总计涉案金额约17亿元,涉及投资人4230人。
中央财经大学法学院互联网金融与民间融资法治研究中心执行主任郭华在接受法治周末记者采访时表示,过去打击非法集资主要依靠参与者的报案、投诉,甚至是上访,公安部门才能掌握这些线索。
这样打击非法集资的方式容易带来一个问题:公安部门介入的时机难以把握。“非法集资很多时候是一个由合法逐渐转为非法的过程,介入过早,一部分获得利益的投资者会对打击非法集资的部门不满;介入过晚,往往财产难以追回,投资者的权益很难得到保障,投资者也会有不满。”郭华说。
如何尽可能地早些发现非法集资风险,并向监管部门作出预警,提前介入,尽可能地保障投资者的权益,尤其是将一些打着互联网金融旗号的伪P2P机构、伪私募机构识别出来,做到提前监测和预警,就显得至关重要,而在这方面,大数据有很大的发展空间。
大数据打非登场
沈鸿对法治周末记者表示,过去非法集资更多是通过线下开展讲座、发传单、发展会员的方式进行,但随着互联网技术发展,非法集资的宣传和组织也开始往线上迁移。
正是由于非法集资在互联网上留下了越来越多的痕迹和数据,沈鸿介绍,从2013年起,北京市金融局就尝试通过大数据监测的方式将打击非法集资的工作端口前移。经过两年多的研究,今年5月“打击非法集资监测预警平台”正式上线。
据法治周末记者了解,目前提供该平台数据服务的为北京金信网银金融信息服务有限公司(以下简称“金信网银”)。
金信网银常务副总经理李崇纲告诉法治周末记者,如果简单套用最高院司法解释中对非法集资认定的“四要件”去套如今的互联网金融,尤其是P2P行业,那么很多P2P平台都有可能涉嫌非法集资,但这样的界定和监管其实也不是监管机构所期望的。
“通过对已经跑路的200余家P2P机构进行分析,我们发现它们存在的风险特征有欺诈风险、市场风险、操作风险、信用风险等,而且在发展不同阶段呈现出不同的特征值,我们据此构建了风险评估模型,然后将现有的平台数据与该模型进行比对,可以有效地发现预警非法集资活动。”李崇纲说。
李崇纲向记者介绍了该预警平台的工作原理:首先,从财经网(博客,微博)站、P2P网站、贴吧、工商税务网站、社交媒体、法院、12345(市非紧急救助服务热线)等数据源大规模的采集原始数据,并根据行业、区域、产品对数据自动分类,标引并存储在金融风险分析大数据平台中。
其次,对多个数据源的数据,在内存式计算平台上进行分布式计算,经过数据清洗、数据集成、数据变换、数据规约等一系列预处理过程,把数据集合统一转换成可供分析的结构化数据。最后,通过分析算法,依照此前建立的多个风险预测模式,计算出不同的风险指数,再通过整合,可最终得出非法集资风险指数。
就P2P网贷平台而言,李崇纲介绍,主要从平台特征(公司信息、关联企业、团队构成)、项目特征(项目特征、收益情况、项目期限)、安全特征(技术保障、担保保障、法律保障等)三个方面采集信息。
在对上述数据处理后,会抽象出五个特征:合规性指数、特征词命中指数、传播力指数、收益率偏离指数以及投诉率指数,分别对应非法集资的非法性、社会性、公开性、利诱性。
通过对这些指数进行加权平均,就可以得出一个非法集资风险指数,也称“冒烟指数”。李崇纲介绍,如果指数为60—80区间,则意味着其非法集资的风险非常高,需要公安部门介入;指数为40—60区间,则需要监管部门密切关注。
为了确保模型的准确性,金信网银还借助公安部门和北京市金融局实际办案的反馈情况,对数据模型进行回测,以进一步优化模型。
李崇纲告诉法治周末记者,今年以来,公司根据大数据的监测情况向相关部门报送了30余起涉嫌非法集资的情报线索,其中有几起已经进入侦查阶段。
中关村(000931,股吧)大数据产业联盟副秘书长陈新河告诉法治周末记者,目前大数据已经越来越广泛地运用于政府机构的监管和社会管理上,此前证监会就通过利用大数据监察系统打击“老鼠仓”和内幕交易,取得良好的效果。
“利用大数据技术从海量数据中快速锁定目标,也有助于降低监管成本,提升监管效率。”陈新河说。
大数据现非集蛛丝马迹
尽管从事非法集资的行为越来越隐蔽,但是通过对跑路平台行为特征进行研究,还是可以从中发现一些规律,或者是涉嫌非法集资平台的共性来。
李崇纲介绍,目前互联网金融行业发展迅猛,却又鱼龙混杂。一些平台为了博取投资人的信任,特别偏爱“傍大款”,对于这样的平台要提高警惕—2014年6月跑路的“网金宝”平台,就曾在官网宣称同中国人民银行正式签署了战略合作。
此外,一些存有非法集资风险的平台多通过举办一些收益率颇高的优惠活动招揽投资者。还以网金宝为例,李崇纲介绍,去年5月26日,其发起了一个名为“天降财牛”的活动,只要投资1万元就能获得不同数额的返现,而且返现可以当日提取,过于丰厚的回报使得投资者争相涌入。
据媒体报道,贵州一位投资者在成功尝试一次后,索性将自己辛苦攒下的16万元存款全部投放了进去。同时还发动身边亲友,累计共投资了45万元。不过,活动持续了不到十天,投资者就发现其网站已经无法打开,客服热线无法接通。宣称的办公地址也不存在。
此外,通过对此前跑路平台特征进行梳理,李崇纲发现,不少平台的工商登记信息变动颇为频繁。一些非法集资风险高的平台或者机构,往往会在短时间内频繁变更公司股东和法定代表人。
“根据监测,曾经有一家平台在一个月的时间内曾连续5次变更股东或者其他工商注册信息,而且一些平台的每个股东名下可能有十余家公司,这些公司之间又存在纵横交错的复杂关联关系。如果是一家正常运作的公司,是很少出现这种情况的。”李崇纲说。
根据研究和分析,李崇纲还发现,一些蓄意跑路或存在非常大的非法集资风险的平台,都非常善于抓政策法律的空子。
以注册资本登记制度改革为例,2014年2月7日,国务院下发了《注册资本登记制度改革方案》,根据要求,从2014年3月1日起,公司实收资本、股东认缴、实缴出资额、出资方式、出资期限不再作为登记事项,企业办理设立及变更时,由公司自行在市场主体信用公示系统上公示注册资本实缴情况。
李崇纲告诉记者,根据大数据平台的监测,一些P2P平台紧抓这一时机,变更自己的注册金额数量,“有的平台原先注册资金只有区区几十万元,瞬间就变更到了几千万元,甚至上亿元”。
“很多投资者,其实是很难知道平台是否真的有这么雄厚的资金实力,但这样的显示结果的确会增加平台的信誉。”李崇纲表示,根据监测,很多出现问题的平台大都利用该制度变革契机,来提升公司注册资本。
有鉴于此,在该大数据预警体系中,短期内提供过高的收益率、频繁变动公司股东、在特定时间段提高公司注册资本金额都会予以特别关注。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31