大数据征信六大难题待解
随着消费金融、网络借贷等互联网消费模式快速增长,以及大数据技术突飞猛进,大数据征信服务机构开始大量涌现。但多元化、多层次征信市场体系建设面临一系列挑战,有很多难题尚未破解。
一是数据的质量、共识性问题。相比于央行征信系统的共识性、数据质量的高可靠性,大数据征信机构虽然数据来源更加宽泛、品种更加丰富,但数据质量、共识性受到质疑。美国国家消费者法律中心2014年3月对主要的大数据征信公司进行调查后并发表了题为《大数据,个人信用评分的大失望》的调查报告,报告称,大数据征信公司的信息错误率高于50%。这些公司的数据模型繁多又复杂,使用不准确的数据,有“垃圾进,垃圾出”之嫌。
二是同人不同信用问题。决定大数据模型预测准确性的两个关键因素是数据和算法,各家征信机构的基因不同,数据来源不同。目前八家机构中,鹏远、中诚信、中智诚是传统型的征信机构,数据来源主要是金融数据、公共数据为主,而芝麻、腾讯、前海、考拉、华道则除了接入传统数据外,主要大量用的是自身场景下积累的数据,这导致信用评估结果在不同公司间存在差异。
三是个人隐私保护及信息安全问题。根据《征信业管理条例》规定,采集和应用个人征信信息必须要获得征信主体授权,商业银行在向人民银行征信中心报送和查询使用个人征信信息时,必须严格执行此规定,对于报送数据范围、查询用途范围、授权形式、异议处理等都有明确的界定。而大数据征信依赖大量个人的互联网交易记录、社交网络数据,在多重交易和多方接入的情况下,隐私保护的权利边界被淡化,隐私泄露风险被迅速放大,公民维护自己合法权益面临取证难、诉讼难等问题。
四是公共信息的可获取、跨机构信息的可交换问题。如前分析,目前多家个人征信试点机构的信息来源带有浓厚的自身经营特点,申请个人征信试点机构大多首先拥有自己的具有垄断性的数据资源。而大数据征信要求的是信息的共享,而不是局部的垄断和壁垒。跨机构拥有的信息是否可交换,哪些需要获得信息主体的授权,如何保证交换过程和交换后信息不被滥用,在法律、监管、技术等方面都缺乏标准。同时,工商、税务、司法等公共政务信息的可持续获取,尚得不到保证。目前的主要做法是,各家征信机构或信息使用机构分散地获取这类信息,获取成本高,数据质量和数据的可持续维护得不到保证。
五是信息滥用带来的社会安全、公平交易问题。从首批试点的八家个人征信机构的运营情况看,市场开放之后,芝麻信用、腾讯征信、考拉征信等机构开始了一轮激烈的追逐赛,纷纷推出各自的评分产品,并争相在金融、购物、招聘、租车、租房、交友、酒店入住等领域尝试应用。但是,这些机构绘制出的人物“肖像”能否真实反映个人信用还令人质疑,获取信息所采用的关键技术的可靠性还有待进一步检验,没有制约的商业化应用很可能带来安全隐忧或消费歧视。
六是征信机构的独立性问题。从各国征信机构的发展历程看,狭义的征信主要是为放贷机构的风险管理提供信息支持的活动,遵循“信息采集者与信息产生没有任何关系”的独立第三方原则。而目前试点的几家征信机构多不是独立的第三方,一方面他们的数据来源于母公司,另一方面其兄弟公司又涉足放贷业务。评分结果对于其各自经营领域的客户分析、风险判断具有强相关性,但其他应用场景下评分结果的相关性则有待验证。
总之,围绕建立多元化的征信体系这一大目标,需要在健全信用管理法律法规,完善信用数据标准体系,加快各类公共信用信息基础平台建设,强化征信业监管等方面多方探索,既要大力推进,又要脚踏实地,不能指望一蹴而就。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“最近复购率一直在下降,我们的营销力度不小啊,为什么用户还是走了?” “是不是广告投放的用户质量不高?还是我们的产品问题 ...
2025-02-21以下文章来源于数有道 ,作者数据星爷 SQL查询是数据分析工作的基础,也是CDA数据分析师一级的核心考点,人工智能时代,AI能为 ...
2025-02-19在当今这个数据驱动的时代,几乎每一个业务决策都离不开对数据的深入分析。而其中,指标波动归因分析更是至关重要的一环。无论是 ...
2025-02-18当数据开始说谎:那些年我们交过的学费 你有没有经历过这样的场景?熬了三个通宵做的数据分析报告,在会议上被老板一句"这数据靠 ...
2025-02-17数据分析作为一门跨学科领域,融合了统计学、编程、业务理解和可视化技术。无论是初学者还是有一定经验的从业者,系统化的学习路 ...
2025-02-17挖掘用户价值本质是让企业从‘赚今天的钱’升级为‘赚未来的钱’,同时让用户从‘被推销’变为‘被满足’。询问deepseek关于挖 ...
2025-02-17近来deepseek爆火,看看deepseek能否帮我们快速实现数据看板实时更新。 可以看出这对不知道怎么动手的小白来说是相当友好的, ...
2025-02-14一秒精通 Deepseek,不用找教程,不用买资料,更不用报一堆垃圾课程,所有这么去做的,都是舍近求远,因为你忽略了 deepseek 的 ...
2025-02-12自学 Python 的关键在于高效规划 + 实践驱动。以下是一份适合零基础快速入门的自学路径,结合资源推荐和实用技巧: 一、快速入 ...
2025-02-12“我们的利润率上升了,但销售额却没变,这是为什么?” “某个业务的市场份额在下滑,到底是什么原因?” “公司整体业绩 ...
2025-02-08活动介绍 为了助力大家在数据分析领域不断精进技能,我们特别举办本期打卡活动。在这里,你可以充分利用碎片化时间在线学习,让 ...
2025-02-071、闺女,醒醒,媒人把相亲的带来了。 我。。。。。。。 2、前年春节相亲相了40个, 去年春节相亲50个, 祖宗,今年你想相多少个 ...
2025-02-06在数据科学的广阔领域中,统计分析与数据挖掘占据了重要位置。尽管它们常常被视为有关联的领域,但两者在理论基础、目标、方法及 ...
2025-02-05在数据分析的世界里,“对比”是一种简单且有效的方法。这就像两个女孩子穿同一款式的衣服,效果不一样。 很多人都听过“货比三 ...
2025-02-05当我们只有非常少量的已标记数据,同时有大量未标记数据点时,可以使用半监督学习算法来处理。在sklearn中,基于图算法的半监督 ...
2025-02-05考虑一种棘手的情况:训练数据中大部分样本没有标签。此时,我们可以考虑使用半监督学习方法来处理。半监督学习能够利用这些额 ...
2025-02-04一、数学函数 1、取整 =INT(数字) 2、求余数 =MOD(除数,被除数) 3、四舍五入 =ROUND(数字,保留小数位数) 4、取绝对值 =AB ...
2025-02-03作者:CDA持证人 余治国 一般各平台出薪资报告,都会哀嚎遍野。举个例子,去年某招聘平台发布《中国女性职场现状调查报告》, ...
2025-02-02真正的数据分析大神是什么样的呢?有人认为他们能轻松驾驭各种分析工具,能够从海量数据中找到潜在关联,或者一眼识别报告中的数 ...
2025-02-01现今社会,“转行”似乎成无数职场人无法回避的话题。但行业就像座围城:外行人看光鲜,内行人看心酸。数据分析这个行业,近几年 ...
2025-01-31