听说的多,见过的少:大数据征信怎么做的
4月2日,北京温特莱大厦,宜信大数据创新中心副总经理雷鹏向记者演示了宜信大数据授信的成果。
一家在eBay上运营的商户,在授权宜信获得其相关经营数据后提交贷款申请,随后,几乎以实时的速度获得宜信十万元的授信额度。
雷鹏演示的是宜信基于大数据的信用贷款产品——商通贷,通过与知名电子商务平台eBay合作,面向eBay上的中国商户发放信用贷款,这一点与阿里小贷的模式比较相似。
互联网技术的发展,让大数据成为“风口上的那头猪”,但是有关大数据的应用多存在理念方面,大数据在现实生活的应用尚处于探索阶段。对于金融业至关重要的征信领域,大数据能够发挥多大的作用?以互联网金融公司为代表的新兴金融业率先对这一领域进行探索。
宜信自去年以来组建大数据创新中心,重点研究大数据征信的应用。商通贷是宜信探索大数据征信的一次尝试,于2014年9月开始运营。据宜信公司高级副总裁、大数据创新中心总经理张小沛透露,通过与eBay等电商平台的合作,宜信已经通过商通贷发放数亿量级的贷款,贷款逾期率几乎为零。而在此之前,宜信P2P业务宜人贷已经通过大数据征信开发出极速放贷模式,同样可以实现实时放贷,并保持相当低的逾期率。
现在的问题是:作为“听说的人多,看见的人少”的大数据征信的在现实生活中如何应用?通过宜信商通贷的研发或许可以得到一些答案。
宜信商通贷大数据征信样本
宜信在大数据上的投入可谓大手笔,为组建大数据创新中心,唐宁从美国找来一直致力于大数据研究的张小沛,此前,张小沛在美国HULU等平台负责大数据广告精准投放,对于大数据有多年实操经验,而其团队的多位科学家均来自HULU和国内科研机构。
去年9月份,宜信大数据创新中心推出商通贷,其目标客户是中小型电商。
以商通贷的合作伙伴eBay为例,在eBay上的中国商户多从事出口行业,对流动资金需求较高。
“在华南、华东有十几万外贸电商在eBay开店,然后将产品卖到全球去,这些人去银行融资挺难的,因为很多人是80后,可能车房等固定资产在手里头,银行就挺难去衡量他的信用的。”张小沛谈到宜信商通贷的目标客户时表示。
商通贷接入eBay平台后,商户只要授权宜信获得自己的经营数据以及社交等数据,宜信便可综合评估店铺经营数据,评价数据和其他互联网数据,结合自己独特的信用风险评分模型,在30秒内即可完成对申请者的授信,并作出付款判断,申请者最高可获得100万的授信。
欲在30秒内完成授信,大数据征信是核心,而数据采集正是难点所在。
数据采集最重要的是需要数据的真实性,这也是商通贷一开始选择eBay、亚马逊等国际电商合作的主要原因,以避免国内电商存在的刷单行为。
宜信在与eBay谈数据开放时,eBay法务部大约对这一合作审核了三个月的时间,其中很重要的原因是担心商户数据泄露。
“像这种合作都要在eBay美国审批,对一个美国公司在合作中要把数据分享给一家中国的实体来说,有非常多的问题和挑战,我们中间做了大量的工作,提供公司资质、各方面的良好的记录。” 雷鹏表示。
获得eBay同意和商户授权后,宜信商通贷才能接入商户后台进行大数据分析。其基本的原理是:宜信从eBay平台获取商户过去2年到4年的连续经营的记录,这些记录反映了商户的交易情况,包括退换货、客户满意度、物流,当这些信息被传递回来后。宜信再将这些数据放入大数据分析模型去判断,然后给商户一个合理的额度。
那么哪些数据是宜信大数据分析模型中所必须的变量呢?雷鹏认为可以分为四个方面:
第一,要确定借款人身份的真实性。首先确认借款人是真实的,在eBay业务的业务也得是真实的,这就需要商户开放数据给宜信。所以在申请材料中,店铺注册人与实际经营人是中国籍公民(港澳台除外),22-55周岁(含);
第二,要确认借款人的社交关系。人是社会动物,社交关系是真实存在的。亲朋好友之间的关系更是一种具有社会约束力的力量。
“孤零零一个人,很难将信用这个事儿变成一个有约束力的事儿。所以社交关系很重要,就是能形成一种社会的约束力。不按信用做事情会有社会压力。”雷鹏表示。他表示宜信可以通过技术手段,运用大数据透过各种网络信息获得个人的各种社交关系。因此,在申请贷款时,商通贷的借款人还要提交三个相应的联系人,包括亲属和同事等。
第三,经济能力和还款能力。宜信可以从平台上和其他数据源上获得借款人的综合信息,包括银行交易流水,退单情况,业务的季节性因素、客户满意度等,这些维度的数据可以用来确认借款人的还款能力的。
第四,还款意愿。有的人有还款能力,但有时候会忘记还款,有的人属于恶意拖欠。因此判断个人的还款意愿难度很大,宜信所做的是通过对借款人既往违约记录和对信用的守约性等额外信息的判断,包括电话欠费记录等。
“所以我们讲起大数据,可大到非常大,但是真的梳理逻辑,基本上就这四个大的维度,然后在这个维度内,逐一提供更丰富的信息,去更精准的判断。”雷鹏表示。
数据模型分析征信应用
要实现雷鹏所说的精准判断,宜信需要通过大数据征信模型对数据进行加工和深度分析,将所有的数据融在一起做成N个模型,然后对借款人的信用进行判断。
在美国做过多年广告搜索引擎的张小沛认为,所有的数据都是信用数据,宜信的大数据开放系统并不是传统金融机构应用的分析模型,在她看来传统金融机构应用的数据分析模型,最多只能放几百个变量,而在互联网广告精确搜索中可以将几十万甚至几百万个变量放进模型里,只需要通过机器学习,便可以对数据进行精准的分析,宜信的大数据征信模型正是将互联网的技术手段应用到了垂直的金融授信额度预估场景里面。
“机器学习没有那么神奇,要得出结论,必须要有一些样本数据,正样本和负样本,正样本是借债还钱的好客户,负样本是借了不还的客户。”张小沛表示。
从这个角度来说,宜信在8年多的时间里已经积累了200多万的客户,有大量的正负样本。而有的P2P企业刚刚起步就开始说自己可以做大数据分析,张小沛认为这种事情不可思议。
“他连正样本、负样本都没有,我都不知道是怎么做出来的。”张小沛表示。在她看来,即使只有正负样本其实也不一定能够做出精确的数据,因为还要有对整同维度领域的知识有深刻理解,这些都是走过弯路、交过很多学费走过来的.
张小沛所说的弯路和学费,其实是指宜信在多年的经营过程中出现的违约现象,而这些违约现在从大数据分析的角度来看,反而可以作为参考样本,加入数据分析模型中,进而实现更为客观的征信判断。同时她并不认为数据模型可以完全的避免出现违约,而是一个不断修正和不断迭代过程。
“如果模型算出来百分之百都是对的,那是有问题的。说明整个金字塔里头你只考虑到尖端人群,所以不管做精准广告还是做信用信贷的审核,当看到每一个都是正确的时候,应该非常谨慎的下探,去探索边界,找到平衡。否则你就漏掉了太多值得服务的人群。”
但是即便如宜信这样在普惠金融领域深耕多年,并积累多年的数据资源,走过很多弯路的互联网金融企业,在应用大数据方面也存在不少掣肘。
“撬动社会多方的资源才可能真正形成大的大数据,所以在这个地方真正难度大的地方不是在技术上,而是在数据的来源上。”雷鹏对凤凰财经表示。
而数据来源的难点也不只是在采集上,雷鹏认为难点是各个利益方怎么样进行合作,自愿地把数据分享出来。实际上真正把这个分享落地的过程中,信用关系是一方面,利益分配是另一方面,技术操作、落地、还有时效性都是可能潜在的挑战。为此,在推出商通贷的过程中,宜信并不仅仅介入ebay等电商平台,还和其他数据平台有合作,以获得庞大的数据进行分析。
宜信最希望接入的数据方就是央行征信中心的数据,但是由于互联网金融公司法律地位未明,至今这一需求尚处于探索之中,唐宁认为互联网金融公司接入央行征信系统已经到了临门一脚的时刻了。
在唐宁看来随着互联网金融发展,随之产生了一人多贷,多头负债等问题,如果P2P能够接入到央行征信之中,一方面是从央行那里获取数据,一方面把宜信多年积累的上千万数据能够央行征信体系之中,对于整个的金融体系建设非常重要。
“就我们几年下来积累的话,真正服务过的客户就有真正快两百万,那么真正有申请的话来讲的话,那是上千万,这是非常宝贵的数据。”唐宁表示。
商通贷应用场景探索
商通贷在推广中要解决的是应用场景的问题。当前,国内大型电商如淘宝、天猫、京东均在打造自身的金融体系,阿里旗下的阿里小贷可以为淘宝、天猫上的商户服务,并积累了多年的运营经验,后来者如京东也在不遗余力的打造自己的供应链金融,二者的共同点是打造自己的商业闭环。
目前的情况是,做金融出身的宜信并不具备这种商业闭环的条件,但在唐宁看来专业做金融是自己的优势所在,毕竟随着互联网的发展,电商将成为趋势,而不是几家电商平台高度垄断,而商通贷瞄准的恰是这部分中小电商。另外,他认为随着电子商务的发展,电商与金融的分工会更加明确。
以美国为例,ebay和亚马逊都是巨无霸型的电子商务平台,他们并没有做自己的金融系统,而是专业的做电商,在金融领域选择和其他金融企业合作,而中国实现这种分工还需要一个过程。虽然如此,张小沛认为宜信的第三方身份也有利于其与其他电商合作,而不是向京东与阿里一样互相排斥。
“你专注做你的电商,我来帮你做金融服务,嵌到你的场景里头去,实际上是帮你提高转化率的,帮你把你的闭环做得更顺畅这样子的,我这个中间各自有各自的价值,最后是共赢的关系。”张小沛表示。
此外,相对于阿里与京东的闭环模式,宜信商通贷还面临着对商户掌控能力的挑战。
以阿里小贷为例,阿里巴巴掌握了天猫与淘宝上的商户的经营数据,一旦这些商户出现借贷违约情况,阿里小贷具有较强的主动性,可以减少自身的损失。而商通贷主要通过与其他电商平台的合作,获得授权方能获得用户数据,而且对商户不具备强制性。这要求宜信必须在大数据分析上拥有更强的竞争力,而这对刚刚起步的大数据征信是一个挑战。
在唐宁看来,宜信已经在大数据征信上处于领先地位,一旦把这个挑战解决了,宜信商通贷就可以面向所有电商平台和数据伙伴提供服务,并不局限于某一个体系之中,这需要宜信在大数据征信中不断的探索。
数据分析咨询请扫描二维码
《Python数据分析极简入门》 第2节 6 Pandas合并连接 在pandas中,有多种方法可以合并和拼接数据。常见的方法包括append()、conc ...
2024-11-24《Python数据分析极简入门》 第2节 5 Pandas数学计算 importpandasaspdd=np.array([[81,&n ...
2024-11-23数据分析涉及多个方面的学习,包括理论知识和实践技能。以下是数据分析需要学习的主要方面: 基础知识: 数据分析的基本概念 ...
2024-11-22数据分析适合在多个单位工作,包括但不限于以下领域: 金融行业:金融行业对数据分析人才的需求非常大,数据分析师可以从事经 ...
2024-11-22数据分析是一种涉及从大量数据中提取有用信息和洞察力的过程。其工作内容主要包括以下几个方面: 数据收集与整理:数据分析师 ...
2024-11-22数据分析师需要掌握多种技能,以确保能够有效地处理和分析数据,并为业务决策提供支持。以下是数据分析师需要掌握的主要技能: ...
2024-11-22数据开发和数据分析是两个密切相关但又有所区别的领域。以下是它们的主要区别: 定义和目标: 数据开发:数据开发涉及数据的 ...
2024-11-22数据架构师是负责设计和管理企业数据架构的关键角色,其职责涵盖了多个方面,包括数据治理、数据模型设计、数据仓库构建、数据安 ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列技能,以确保能够有效地处理、分析和解释数据,从而支持决策制定。以下是数据分析师所需的关键技能: ...
2024-11-22数据分析师需要具备一系列的技能和能力,以确保能够有效地处理、分析和解释数据,从而支持业务决策。以下是数据分析师所需的主要 ...
2024-11-22需求持续增长 - 未来数据分析师需求将持续上升,企业对数据驱动决策的依赖加深。 - 预测到2025年,中国将需要高达220万的数据人 ...
2024-11-22《Python数据分析极简入门》 第2节 4 Pandas条件查询 在pandas中,可以使用条件筛选来选择满足特定条件的数据 importpanda ...
2024-11-22数据分析师的工作内容涉及多个方面,主要包括数据的收集、整理、分析和可视化,以支持商业决策和问题解决。以下是数据分析师的一 ...
2024-11-21数据分析师必须掌握的技能可以从多个方面进行归纳和总结。以下是数据分析师需要具备的主要技能: 统计学基础:数据分析师需要 ...
2024-11-21数据分析入门的难易程度因人而异,总体来看,入门并不算特别困难,但需要一定的学习和实践积累。 入门难度:数据分析入门相对 ...
2024-11-21数据分析是一项通过收集、整理和解释数据来发现有用信息的过程,它在现代社会中具有广泛的应用和重要性。数据分析能够帮助人们更 ...
2024-11-21数据分析行业正在迅速发展,随着技术的不断进步和数据量的爆炸式增长,企业对数据分析人才的需求也与日俱增。本文将探讨数据分析 ...
2024-11-21数据分析的常用方法包括多种技术,每种方法都有其特定的应用场景和优势。以下是几种常见的数据分析方法: 对比分析法:通过比 ...
2024-11-21企业数字化转型是指企业利用数字技术对其业务进行改造和升级,以实现提高效率、降低成本、创新业务模式等目标的过程。这一过程不 ...
2024-11-21