大数据风控已显山露水哪些数据才是风控所需？-CDA数据分析师官网

热线电话：13121318867

大数据风控已显山露水哪些数据才是风控所需？

2016-03-04

大数据风控已显山露水哪些数据才是风控所需？

美国科学家近日宣布探测到引力波的存在，如获证实，将是物理学界里程碑式的重大成果。一时间，“引力波”成为热词，相关的知识普及也随之而来。然而，5年前国内一位下岗工人在节目上提及引力波时，却遭到了在场嘉宾的讥讽，这位工人还没有对自己的“发明发现”做详细阐述，便被频频打断和否定，只得匆匆下场。五年后的如今，引力波被捕捉到有存在的痕迹，着实是戏剧化的一幕。

当引力波还是一个新鲜事物时，人们没有预见到它的未来，甚至有人无知地直接否认它的存在。这让我也想到“青蒿素”，在屠呦呦教授没拿奖之前也无人所知。然而，纵然当初无人问津，如今可不是大放异彩。

如今的“大数据风控”这一词，或许就如五年前的“引力波”、一年前的“青蒿素”一样，尚处于一个初生试水、萌芽之姿的阶段，机遇与挑战并存。一方面，不可否认地存在鱼龙混杂、乱象丛生的问题，”挂羊头卖狗肉”有名无实的事例也有，对于一些没有核心数据却吹嘘数据风控的大忽悠平台我们当然要擦亮火眼金睛。做大数据风控本要求的是硬技术，谁能真正掌握谁才能扎根发展，行业内已经出现了一些有益的探索，显示了用大数据做风控的优势。

大数据风控已显山露水哪些数据才是风控所需？

大数据风控已显山露水

目前市场的大数据风控系统现状是：大公司通过大数据挖掘，自建信用评级系统；小公司通过信息分享，借助第三方获得信用评级咨询服务。

已有的风控大致分为两种模式，一种是类似于阿里的风控模式，他们通过自身系统大量的电商交易以及支付信息数据建立了封闭系统的信用评级和风控模型。另外一种则是众多中小互联网金融公司通过贡献数据给一个中间征信机构，再分享征信信息。

那么，哪些数据才是风控所需的呢？

1、电商大数据

电商平台能够累积大量的交易信息，可作为信用评级参考的原材料。阿里金融是利用电商大数据进行风控的领头羊，在很多行业人士还在云里雾里的时候，阿里已经建立了相对完善的大数据挖掘系统。通过阿里巴巴、淘宝、天猫、支付宝等积累的大量交易支付数据作为最基本的数据原料，再加上卖家提供的销售数据、银行流水、水电缴纳等情况作为辅助数据原料。所有信息汇总后，将数值输入网络行为评分模型，进行信用评级。

2、信贷记录大数据

小贷类网站积累的信贷大数据包括信贷额度、违约记录等等。但单一企业缺陷在于数据的数量级别低和地域性太强。还有部分小贷网站平台通过线下采集数据转移到线上的方式来完善信用数据。这些特点决定了如果单兵作战他们必定付出巨大成本。因此，贡献数据、共享数据的模式正逐步被认可，抱团取暖胜过单打独斗。

3、社交网站大数据

社交大数据是风控大数据的一个重要组成部分。通过社交人际网络关系数据和生活圈中其他如水电煤缴费信息、信用卡还款信息、支付和交易信息等，可以多方面地反映出用户的习惯偏好、价值取向、人际交往、信誉度和活跃度等信息。

利用社交网站大数据进行网络借贷风控的典型是美国的Lending Club。Lending club于2007年在facebook上开张，通过在上面镶嵌的一款应用搭建借贷双方平台，利用社交网络关系数据和朋友之间的相互信任聚合人气。借款人被分为若干信用等级，但是却不必公布自己的信用历史。

4、信用卡借记类数据

信用卡类网站的大数据同样对互联网金融的风险控制非常有价值。申请信用卡的年份、是否通过、授信额度、卡片种类；信用卡还款数额、对优惠信息的关注等都可以作为信用评级的参考数据。

5、消费数据

第三方支付类平台做风控的机遇在于，能基于用户的消费数据做信用分析。支付的方向、每月支付的额度、购买产品品牌都可以作为信用评级的重要参考数据。

6、生活服务类数据

生活服务类网站的大数据如水、电、煤气、有线电视、电话、网络费、物业费交纳平台则客观真实地反映了个人的基本信息，是信用评级中一类重要的数据类型。

大数据的海量也就意味着，对数据的理解和对有效数据的挑选非常重要，并非所有数据都是风控有用信息。要选取哪些数据原料进行挖掘，什么数据才是金融风控真正所需的，对数据的类型和实效性都要有所考量。

17年前，很多人认为互联网是泡沫，现在证明互联网没被高估；7年前，很多人认为电子商务是泡沫，但今天中国已经有几亿人的电商市场。如今，大数据风控方兴未艾，也伴随着一些泡沫，但只要它朝着健康的方向发展，未来已来。大数据的相关理论与分析方法，很好地弥补了数据获得的时间连续性、数据的地理位置分布、数据样本的覆盖程度等传统分析方法中的不足，其精准度更高、覆盖面更广和响应速度更快的特点，运用到风险防控中大有裨益。大数据风控本身并非是忽悠，是真的具有发展的潜力，只是其研究还更待成熟。

最后借助苏萌教授在进行大数据辩论时的一句总结：所有新鲜事物都需要一定的泡沫，才能吸引到更多的投资和关注，最终才能让真正好的东西沉淀下来。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

大数据数据挖掘

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇关于工业物联网你不知道的三件事

下一篇大数据分析工具为创业者提供更多机会

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

大数据风控已显山露水哪些数据才是风控所需？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】数据清洗全指南：基础核心+常用工具实操 ...

【CDA干货】数据挖掘与数据分析：区别、联系与职场 ...

CDA数据分析师：精通统计制图，让数据规律直观可感 ...

【CDA干货】MySQL分区键后，其他索引还生效吗？真相 ...

【CDA干货】Tableau同比环比增长率实操全指南：从入 ...

CDA数据分析师：特征处理实操指南，打通数据到价值 ...

【CDA干货】机器学习算法工程实用案例解析：从落地 ...

【CDA干货】卷积神经网络与无迹卡尔曼滤波融合：原 ...

CDA数据分析师：数据清洗实操指南，筑牢数据分析的 ...

【CDA干货】决策树模型变量重要性排序：原理、方法 ...

【CDA干货】Excel卡方检验实操全指南：从原理到落地 ...

CDA数据分析师：数据整合实操指南，打破数据孤岛， ...

【CDA干货】数据分析全流程常见问题：成因、危害与 ...

【CDA干货】维度表与事实表：数据仓库的核心双子星 ...

CDA数据分析师：数据读取实操指南，打通数据价值转 ...

【CDA干货】用户行为分析中泛化性指标：计算方法、 ...

【CDA干货】以数为鉴，读懂用户：三大行业用户行为 ...

CDA数据分析师：量化策略分析框架，解锁数据驱动决 ...

【CDA干货】随机森林模型训练全解析：从参数调优到 ...

【CDA干货】随机森林算法重要性分析：原理、实操与 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

大数据风控已显山露水 哪些数据才是风控所需？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】数据清洗全指南：基础核心+常用工具实操 ...

【CDA干货】数据挖掘与数据分析：区别、联系与职场 ...

CDA数据分析师：精通统计制图，让数据规律直观可感 ...

【CDA干货】MySQL分区键后，其他索引还生效吗？真相 ...

【CDA干货】Tableau同比环比增长率实操全指南：从入 ...

CDA数据分析师：特征处理实操指南，打通数据到价值 ...

【CDA干货】机器学习算法工程实用案例解析：从落地 ...

【CDA干货】卷积神经网络与无迹卡尔曼滤波融合：原 ...

CDA数据分析师：数据清洗实操指南，筑牢数据分析的 ...

【CDA干货】决策树模型变量重要性排序：原理、方法 ...

【CDA干货】Excel卡方检验实操全指南：从原理到落地 ...

CDA数据分析师：数据整合实操指南，打破数据孤岛， ...

【CDA干货】数据分析全流程常见问题：成因、危害与 ...

【CDA干货】维度表与事实表：数据仓库的核心双子星 ...

CDA数据分析师：数据读取实操指南，打通数据价值转 ...

【CDA干货】用户行为分析中泛化性指标：计算方法、 ...

【CDA干货】以数为鉴，读懂用户：三大行业用户行为 ...

CDA数据分析师：量化策略分析框架，解锁数据驱动决 ...

【CDA干货】随机森林模型训练全解析：从参数调优到 ...

【CDA干货】随机森林算法重要性分析：原理、实操与 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

大数据风控已显山露水哪些数据才是风控所需？