热线电话:13121318867

登录
首页精彩阅读互联网征信陷“数据孤岛”_数据分析师
互联网征信陷“数据孤岛”_数据分析师
2015-04-27
收藏

互联网征信陷“数据孤岛”_数据分析师


互联网征信究竟可不可信,随着大数据征信的逐渐变现,这一话题再掀波澜。支付宝“芝麻信用”界面悄然上线信贷产品“好期贷”;京东白条也正在与 51信用卡合作开发系统为用户增加征信,而其风控依赖的标准主要是互联网征信。在复杂的互联网时代,线上数据的准确性有待商榷,国内的互联网征信实则是 “雾里看花,水中望月”。

  大数据征信追逐赛开始

  互联网企业的创新速度一向是火箭级别。今年初,央行开放个人征信市场,8家机构获得准入资格,拉卡拉、蚂蚁金服、腾讯等互联网企业抢得准入证,随后,各家企业就展开了一场追逐赛。

  以蚂蚁金服旗下的“芝麻信用分”打头炮的芝麻信用进度最快,除了“花呗”、租车、住宿等产品外,芝麻信用界面近日又悄然接入了招联消费金融有限 公司的信贷产品“好期贷”,芝麻信用评分达到700分的用户即可在线申请1万元以内的贷款。此外,以芝麻信用分作为审批依据的产品“借呗”也将上线,额度 上限达到5万元。

  拉卡拉则推出了个人和商户两类信用分,个人信用分可以在拉卡拉App中查询,数据集中于一个独立平台,任何一个使用POS机的商户都可以到考拉 征信体系里面评估他的商户信用分,当商户的信用分达到一个级别以上,就可以跟拉卡拉申请贷款,不需要抵押和担保,并且贷款的利率根据信用分来评定。此外, 拉卡拉还推出了企业信用分。

  互联网征信日益流行,越来越多的信贷产品使用互联网征信体系提高风控、拓展业务。北京商报记者近日了解到,京东白条也准备引入51信用卡管家为用户增加征信,目前正在系统开发阶段,双方的合作模式相当于设立一张“联名信用卡”为用户增信。

  对于互联网征信,其来源是互联网金融平台沉淀的大数据,并通过数据建模,最终输出每个人的诚信模型,以此为标准,系统自动判断可以借给谁钱、借多少。不过,由于互联网金融在国内兴起的时间尚不足两年,大数据征信的可靠性和含金量仍被不少业内人士质疑。

  线上信息准确性待商榷

  互联网时代各个行业瞬息万变,比如对于互联网征信依赖较大的P2P行业,此前不少平台都宣称自己为“纯线上的信息中介”,但是在行业发展几年以后,不少P2P平台仍然选择了线下布局,一方面可以节约成本,另一方面则是通过线下风控降低风险。

  但是仍有不少互联网金融行业人士宣称单纯依靠大数据模型、人像建模等技术进行风控。

  开鑫贷副总经理周治翰直言,如果要支持小微企业,靠纯线上的风控模式不够现实,首先没有完备的线上交易记录,没有国外完善的征信系统,小微企业 主可能连网上提交申请都不会。同时,如果电商企业根据交易商户或者个人的流水来判定征信情况或者进行风控,也存在不准确的可能,比如个人的购物情况看起来 虽然交易量较大,但可能是帮助其他人或者企业进行采购,所以单纯依靠线上数据可能有很多虚假信息。

  同时,比如P2P行业服务的大都是传统金融机构无法覆盖的人群,这些人也许从未在银行等金融机构有借贷或信用卡使用,而借助大数据征信可抓取的数据有效性又有多高?

  据公开数据显示,央行征信中心的数据覆盖人口达到8亿人,但是其中真正有信贷记录的仅3亿人,5亿人没有任何信贷记录。而中国的个人征信报告, 目前只是各商业银行历史信用数据的汇集,现在大量原始数据都分散在金融机构、司法、工商、税务、公用事业单位等部门,想要获得这些数据并不容易,这导致大 数据征信缺乏数据支持和依托。

  金信网首席运营官安丹方认为,用大数据进行信用评估时,很多数据会涉及个人隐私,尤其是对个人社交圈和电商交易的数据、通话记录、微博数据的应 用。目前国内关于个人隐私方面的保护几乎处于空白,过快推进大数据征信,企业将有可能面临法律和道德风险。而国内对失信行为的惩戒制度不够健全,导致借款 人违约成本较低,难以有效抑制违约风险。“民间机构的交易数据形态各异,对数据的定义不同、业务操作规范不同,授信标准也不同,很难形成统一的数据标准供 行业共享。而征信企业之间存在竞争,数据是各家企业的核心资产,想要实现信息数据的共享难度也比较大。”安丹方直言。

  融360 CEO叶大清也认为,中国目前的征信体系还不足以支撑银行在线放款。传统银行的劣势是只有线下没有线上,但现在互联网时代的趋势让用户把时间都花在线上 了。线下是一个过去的时代,线上是一个新的时代,最好的模式是线上线下结合。线下做两件事,风险控制和服务。

  民间版征信如何进化

  虽然业内人士对于大数据征信的准确性仍持有意见,但不可否认的是,国内的征信市场未来将越来越开放,民间版征信的适用范围也会逐步拓展。那么,大数据征信该如何增强自己的信用价值呢?

  有分析人士表示,互联网征信机构需要不断完善评估模型,充分发挥大数据优势,提高大数据分析模型和方法。改进和完善现有模型、探索和建立新的模 型,使大数据在互联网征信领域进一步发挥作用。在海量数据中挖掘数据之间的内在联系以及预测数据变化趋势,特别是对客户属性、交易记录、评价信息以及商品 信息进行合理预测。

  周治翰认为,互联网征信目前仍需要进行多重交叉验证,即使是征信市场较为完善的美国和德国,通过多个模型交叉验证数据的真假也是必不可少的环节。

  在安丹方看来,大数据征信应当以立法为先。她表示,目前大数据征信的发展还存在数据缺失、隐私信息界定不明等问题,大数据征信的推进应以征信立 法为先。为了规范大数据征信、减少隐私侵害,《个人信息保护法》应尽快出台;针对数据缺失,大量原始数据分散在司法、工商等政府部门的情况,建立在立法层 面使数据采集从私法授权的方式改为公权力授权,即当央行授予民间征信机构征信牌照之后,该机构即拥有央行的公权力授权,可以直接对接拥有原始数据的机关、 企事业单位,但涉及法定保密信息的除外。

  “中国的征信必然会崛起于网络时代,但是需要完善相关法条保驾护航,否则大数据征信推进得越快,恐怕带来的隐患就越多。”安丹方建议,在中国征 信体系尚未真正建立起来前,大数据征信应循序渐进的推进,平台可以把其作为风控的补充,但不宜完全依赖。就目前发展而言,以大数据征信为基础的大数据风控 至少在短期内还无法取代以O2O为主的风控体系。

  复制美国经验需时间

  崛起于网络时代的大数据征信,是拯救者还是毁坏者?中国征信的未来,路在何方?没有完善的征信体系,就没有真正的互联网金融,因而征信体系如何建设从来都是行业争论的焦点,目前国内对于国外征信行业的经验尤其看重。

  美国最大信用评级公司FICO中国区副总裁Sandy Wang表示,美国征信的发展史经历了四个阶段:第一个阶段是疯狂发展的过程,第二个阶段是监管成熟的过程,第三个阶段是合并整合的过程,第四个阶段就是 现在由几家龙头企业主宰的成熟期。当下,中国的征信市场处于第一个时期,市场蓬勃发展,出现多家小而美的征信公司。但是征信的趋势还是要规模化,相信未来 一定还是会出现几家寡头征信企业。

  叶大清表示,美国在上世纪90年代互联网刚刚兴起的时候,1994-1999年就开始做网上申请房贷、信用卡、贷款,用户体验非常好,可以做到 1分钟在线审批。之所以能做到这种水平,是因为当互联网在美国兴起的时候,美国银行已经很成熟了,已经具备了数据分析能力、风险控制能力和决策能力。

  在国内,市场是这样的,“大数据方面其实大家说得多、做得少。京东、腾讯、阿里甚至银行的数据都不全面。而微众银行更多拥有的是社交、行为及QQ浏览器等基于互联网的数据,到现在为止还没有风控方面的数据。

  反过来看银行,银行积累了十几年甚至几十年,它知道放过的款借款人都是谁、收入如何、信用怎么样等,这些借贷数据很详细,但如果一个人从来没有在银行产生过借贷行为,那么银行就判断不了。所以说,互联网的数据和银行的数据各有优劣”。叶大清直言。

  比如FICO的模式就是,首先基于信贷的五类记录(还款历史、当前负债、信贷历史长度等)作为传统的FICO分数的打分基础,虽然强大,但是由 于打分需要的最少记录要求导致整体人群的覆盖范围有限,所以越来越多的第二类非信贷数据被引进到FICO的Alternative Credit Data中(比如电信记录、公共事业费记录、公共记录和房产记录等)。

  值得一提的是,目前国内部分P2P行业已经引入FICO,但是由于国内的数据缺失和准确性问题,FICO在中国的应用也需要经过很长时间的调整和实践修正才能逐渐作为参考采用。

数据分析咨询请扫描二维码

最新资讯
更多
客服在线
立即咨询