大数据风控已显山露水 哪些数据才是风控所需?
美国科学家近日宣布探测到引力波的存在,如获证实,将是物理学界里程碑式的重大成果。一时间,“引力波”成为热词,相关的知识普及也随之而来。然而,5年前国内一位下岗工人在节目上提及引力波时,却遭到了在场嘉宾的讥讽,这位工人还没有对自己的“发明发现”做详细阐述,便被频频打断和否定,只得匆匆下场。五年后的如今,引力波被捕捉到有存在的痕迹,着实是戏剧化的一幕。
当引力波还是一个新鲜事物时,人们没有预见到它的未来,甚至有人无知地直接否认它的存在。这让我也想到“青蒿素”,在屠呦呦教授没拿奖之前也无人所知。然而,纵然当初无人问津,如今可不是大放异彩。
如今的“大数据风控”这一词,或许就如五年前的“引力波”、一年前的“青蒿素”一样,尚处于一个初生试水、萌芽之姿的阶段,机遇与挑战并存。一方面,不可否认地存在鱼龙混杂、乱象丛生的问题,”挂羊头卖狗肉”有名无实的事例也有,对于一些没有核心数据却吹嘘数据风控的大忽悠平台我们当然要擦亮火眼金睛。做大数据风控本要求的是硬技术,谁能真正掌握谁才能扎根发展,行业内已经出现了一些有益的探索,显示了用大数据做风控的优势。
大数据风控已显山露水
目前市场的大数据风控系统现状是:大公司通过大数据挖掘,自建信用评级系统;小公司通过信息分享,借助第三方获得信用评级咨询服务。
已有的风控大致分为两种模式,一种是类似于阿里的风控模式,他们通过自身系统大量的电商交易以及支付信息数据建立了封闭系统的信用评级和风控模型。另外一种则是众多中小互联网金融公司通过贡献数据给一个中间征信机构,再分享征信信息。
那么,哪些数据才是风控所需的呢?
1、电商大数据
电商平台能够累积大量的交易信息,可作为信用评级参考的原材料。阿里金融是利用电商大数据进行风控的领头羊,在很多行业人士还在云里雾里的时候,阿里已经建立了相对完善的大数据挖掘系统。通过阿里巴巴、淘宝、天猫、支付宝等积累的大量交易支付数据作为最基本的数据原料,再加上卖家提供的销售数据、银行流水、水电缴纳等情况作为辅助数据原料。所有信息汇总后,将数值输入网络行为评分模型,进行信用评级。
2、信贷记录大数据
小贷类网站积累的信贷大数据包括信贷额度、违约记录等等。但单一企业缺陷在于数据的数量级别低和地域性太强。还有部分小贷网站平台通过线下采集数据转移到线上的方式来完善信用数据。这些特点决定了如果单兵作战他们必定付出巨大成本。因此,贡献数据、共享数据的模式正逐步被认可,抱团取暖胜过单打独斗。
3、社交网站大数据
社交大数据是风控大数据的一个重要组成部分。通过社交人际网络关系数据和生活圈中其他如水电煤缴费信息、信用卡还款信息、支付和交易信息等,可以多方面地反映出用户的习惯偏好、价值取向、人际交往、信誉度和活跃度等信息。
利用社交网站大数据进行网络借贷风控的典型是美国的Lending Club。Lending club于2007年在facebook上开张,通过在上面镶嵌的一款应用搭建借贷双方平台,利用社交网络关系数据和朋友之间的相互信任聚合人气。借款人被分为若干信用等级,但是却不必公布自己的信用历史。
4、信用卡借记类数据
信用卡类网站的大数据同样对互联网金融的风险控制非常有价值。申请信用卡的年份、是否通过、授信额度、卡片种类;信用卡还款数额、对优惠信息的关注等都可以作为信用评级的参考数据。
5、消费数据
第三方支付类平台做风控的机遇在于,能基于用户的消费数据做信用分析。支付的方向、每月支付的额度、购买产品品牌都可以作为信用评级的重要参考数据。
6、生活服务类数据
生活服务类网站的大数据如水、电、煤气、有线电视、电话、网络费、物业费交纳平台则客观真实地反映了个人的基本信息,是信用评级中一类重要的数据类型。
大数据的海量也就意味着,对数据的理解和对有效数据的挑选非常重要,并非所有数据都是风控有用信息。要选取哪些数据原料进行挖掘,什么数据才是金融风控真正所需的,对数据的类型和实效性都要有所考量。
17年前,很多人认为互联网是泡沫,现在证明互联网没被高估;7年前,很多人认为电子商务是泡沫,但今天中国已经有几亿人的电商市场。如今,大数据风控方兴未艾,也伴随着一些泡沫,但只要它朝着健康的方向发展,未来已来。大数据的相关理论与分析方法,很好地弥补了数据获得的时间连续性、数据的地理位置分布、数据样本的覆盖程度等传统分析方法中的不足,其精准度更高、覆盖面更广和响应速度更快的特点,运用到风险防控中大有裨益。大数据风控本身并非是忽悠,是真的具有发展的潜力,只是其研究还更待成熟。
最后借助苏萌教授在进行大数据辩论时的一句总结:所有新鲜事物都需要一定的泡沫,才能吸引到更多的投资和关注,最终才能让真正好的东西沉淀下来。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-02最近我发现一个绝招,用DeepSeek AI处理Excel数据简直太爽了!处理速度嘎嘎快! 平常一整天的表格处理工作,现在只要三步就能搞 ...
2025-04-01你是否被统计学复杂的理论和晦涩的公式劝退过?别担心,“山有木兮:统计学极简入门(Python)” 将为你一一化解这些难题。课程 ...
2025-03-31在电商、零售、甚至内容付费业务中,你真的了解你的客户吗? 有些客户下了一两次单就消失了,有些人每个月都回购,有些人曾经是 ...
2025-03-31在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的需求持续飙升。世界经济论坛发布的《未来就业报告》, ...
2025-03-28你有没有遇到过这样的情况?流量进来了,转化率却不高,辛辛苦苦拉来的用户,最后大部分都悄无声息地离开了,这时候漏斗分析就非 ...
2025-03-27TensorFlow Datasets(TFDS)是一个用于下载、管理和预处理机器学习数据集的库。它提供了易于使用的API,允许用户从现有集合中 ...
2025-03-26"不谋全局者,不足谋一域。"在数据驱动的商业时代,战略级数据分析能力已成为职场核心竞争力。《CDA二级教材:商业策略数据分析 ...
2025-03-26当你在某宝刷到【猜你喜欢】时,当抖音精准推来你的梦中情猫时,当美团外卖弹窗刚好是你想吃的火锅店…… 恭喜你,你正在被用户 ...
2025-03-26当面试官问起随机森林时,他到底在考察什么? ""请解释随机森林的原理""——这是数据分析岗位面试中的经典问题。但你可能不知道 ...
2025-03-25在数字化浪潮席卷的当下,数据俨然成为企业的命脉,贯穿于业务运作的各个环节。从线上到线下,从平台的交易数据,到门店的运营 ...
2025-03-25在互联网和移动应用领域,DAU(日活跃用户数)是一个耳熟能详的指标。无论是产品经理、运营,还是数据分析师,DAU都是衡量产品 ...
2025-03-24ABtest做的好,产品优化效果差不了!可见ABtest在评估优化策略的效果方面地位还是很高的,那么如何在业务中应用ABtest? 结合企业 ...
2025-03-21在企业数据分析中,指标体系是至关重要的工具。不仅帮助企业统一数据标准、提升数据质量,还能为业务决策提供有力支持。本文将围 ...
2025-03-20解锁数据分析师高薪密码,CDA 脱产就业班助你逆袭! 在数字化浪潮中,数据驱动决策已成为企业发展的核心竞争力,数据分析人才的 ...
2025-03-19在 MySQL 数据库中,查询一张表但是不包含某个字段可以通过以下两种方法实现:使用 SELECT 子句以明确指定想要的字段,或者使 ...
2025-03-17在当今数字化时代,数据成为企业发展的关键驱动力,而用户画像作为数据分析的重要成果,改变了企业理解用户、开展业务的方式。无 ...
2025-03-172025年是智能体(AI Agent)的元年,大模型和智能体的发展比较迅猛。感觉年初的deepseek刚火没多久,这几天Manus又成为媒体头条 ...
2025-03-14以下的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《小白必备的数据思维课》,点击下方链接 https://edu.cda.cn/goods/sh ...
2025-03-13